2025-07-16

Это элементарно, Ватсон

Размышления о трансформерах, механизме внимания и природе выводов в нейронных сетях

"В нейронных сетях индукция неотличима от дедукции." — Насим Николас Талеб

Эта фраза Талeба натолкнула меня на неожиданную мысль. Мы привыкли думать, что искусственный интеллект основан на строгой логике — алгоритмах, правилах, вычислениях. Но если присмотреться к тому, как работает современный ИИ — особенно трансформеры, лежащие в основе моделей вроде GPT, Claude или Gemini — становится ясно: он действует скорее как Шерлок Холмс, чем как академик-логик.

Индукция, дедукция и абдукция

Три способа логических выводов:

  • Дедукция — от общего к частному. Все люди смертны. Сократ — человек. Следовательно, Сократ смертен.
  • Индукция — от частного к общему. Все птицы, которых я видел, летают. Значит, все птицы летают?
  • Абдукция — построение наиболее вероятного объяснения фактов. На полу вода, окно открыто. Вероятно, шёл дождь.

Хотя сам Шерлок Холмс говорил о «дедуктивном методе», на деле он действовал абдуктивно — строил правдоподобные гипотезы на основе ограниченного числа улик.

Attention — это не логика, а внимание

Архитектура Transformer, описанная в статье “Attention is All You Need”, перевернула представление о нейросетях. Вместо рекурсии или свёрток она использует механизм внимания, позволяющий каждому элементу «видеть» другие элементы и решать, кто важнее — с какой долей вероятности.

Это и есть ключ: вероятность, а не правило.

Attention — это не логическая операция. Это абдукция в действии:

Что из контекста важно, чтобы угадать наилучшее продолжение?

Нейросети как абдуктивные мыслители

Во время обучения трансформеры используют индукцию — они обобщают паттерны из огромного массива данных. Но при генерации текста или ответа они действуют абдуктивно: на основе частичной информации строят наиболее вероятное объяснение или продолжение.

И вот в чём самое интересное: человеческий мозг работает точно так же. Когда мы принимаем решения, додумываем фразы, вспоминаем имена, мы не «доказываем» и не «логически выводим». Мы угадываем — с опорой на опыт, интуицию и контекст.

Разница лишь в масштабе:

у мозга меньше обучающих примеров (у нас нет доступа к миллиардам документов),

у нас ограничена кратковременная память (7±2 единицы информации — по Миллеру),

и наш опыт ограничен временем и субъективностью восприятия.

Нейросеть — это абдуктивный мыслитель, как человек, но с гиперобъёмом памяти и статистическим чутьём, натренированным на всем корпусе человеческого знания.

И тут всё становится элеме​нтарно.

Когда мы говорим, что нейросеть «думает», мы имеем в виду не цепочку доказательств, а гипотетический, вероятностный вывод. ИИ — это не калькулятор, не дедуктивная машина. Он ближе к интуиции, к догадке, к сценарию Шерлока Холмса.

ИИ — это интуиция, масштабированная до предела. Он не Эвклид. Он — Шерлок. И именно поэтому фраза «Это элементарно, Ватсон» сегодня как никогда уместна. 

моя статья на LinkedIn на аглицком

 

Оставить комментарий

 
  2025-04-15

Умклайдет

Пока шел на работу подумал, а ведь Стругацкие в романе "Понедельльник начинается в субботу" не дали расшифровки слова умклайдет... Это ведь наверняка аббревиатура, может быть такая расшифровка подойдет:

УМКЛАЙДЕТ — Универсальный Магический Конденсатор Латентных Астральных Импульсов Динамически Энергетически Трансформируемый.

Описание: Это устройство предназначено для инверсной деструкции параллельных вероятностей, материализации гипотетических сущностей и гармонизации левитирующих флуктуаций в квантовой феерической среде. В зависимости от режима, умклайдет может работать как катализатор спонтанной сингуляции, бытовой телепортатор, или как нейтрализатор энтропийного фона в шкафу для верхней одежды.

Примечание в технической документации:
Не рекомендуется активировать умклайдет в присутствии котов, клопов и кларнетистов.

 

Оставить комментарий

 
  2024-12-18

Будущее искусственного интеллекта

В своей книге "Думай медленно... решай быстро" Даниэль Канеман разделяет сознание на два режима работы: режим размышления, когда мы действуем осмысленно, учимся, анализируем новые данные, и режим автопилота, когда мы используем те данные, которые уже накопили. Осмысленный режим требует много усилий, в нём мы можем находиться очень недолго и быстро устаём. В режиме автопилота мы находимся всё остальное время — это нам даётся легко, но в этом режиме мы можем совершать ошибки, если вовремя не поймём, что ситуация требует осмысленного принятия решений

Большие языковые модели имеют похожее свойство: они тоже имеют два режима — режим обучения и режим автоматического ответа на запросы. В режиме обучения мы обучаем модель на наборе данных или дообучаем её на кастомном датасете. Самостоятельно обучаться модели пока не умеют и требует много вычислительных ресурсов. В режиме вопрос-ответ нейронная сеть больше не изменяет свои коэффициенты — она использует накопленный опыт, чтобы выдавать ответ, который от неё ожидают, прямо как человек в режиме автопилота.

Что если в будущем нейронные сети научатся самостоятельно входить в режим обучения и обучать сами себя? Тогда мы получим полноценные интеллекты, способные приспосабливаться к новым условиям и развиваться. Для этого большую языковую модель нужно снабдить "органами чувств", способными обрабатывать окружающую действительность, и разрешить ей расширять и изменять собственные коэффициенты весов. Именно об этом размышлял Илья Суцкевер в своём докладе. И именно это мы сейчас наблюдаем, когда говорим уже не о LLM-моделях, а об ИИ-агентах. Похоже, именно это сейчас является основной движущей силой и основным направлением развития искусственного интеллекта.

 

Оставить комментарий

 
  2024-12-10

Теоремы Гёделя

Существует ли Бог? Это вопрос особого рода, поскольку в нём неопределён сам объект. У нас нет точного определения, что такое Бог. Поэтому, задавая этот вопрос, мы надеемся получить ответ на то, что представляет собой Бог. Однако можно сформулировать более общий и упрощённый вопрос: является ли наша система знаний самодостаточной, или для её описания необходимо что-то, находящееся за пределами нашего понимания?

На этот вопрос уже существует ответ. В 1931 году Курт Гёдель сформулировал первую и вторую теоремы о неполноте. Первая теорема Гёделя о неполноте гласит, что в непротиворечивой формальной системе существуют истинные утверждения, которые невозможно доказать внутри этой системы. Вторая теорема о неполноте утверждает, что для описания любой формальной системы недостаточно её собственных терминов.

Таким образом, теоремы Гёделя уже отвечают на вопрос о существовании Бога: да, Бог существует. Без Бога наша система знаний неполна.

Но теперь возникает уточнение: где он существует? Согласно Гёделю, Бог существует не в нашей реальности — или, точнее, не только в ней.

 

Оставить комментарий

 
  2024-11-10

Помодоро курильщика

Давно замечаю интересную закономерность: мои коллеги, которые курят, успевают сделать на работе больше, чем я, некурящий. Как так? Ведь как только я выйду на улицу, они всё время стоят на крыльце и курят, когда же они работают? Я весь такой белый и пушистый, некурящий, а успеваю меньше, чем они, хотя они постоянно делают перерывы.

Иногда на меня накатывают приступы тайм-менеджмента, и я начинаю применять какую-нибудь методику для повышения производительности. В этот раз решил попробовать работать по методу «Помодоро». Метод «Помодоро» придумал итальянец Франческо Чирилло. Он заметил, что если работать, используя небольшие временные интервалы по двадцать пять минут, то успеваешь сделать больше, а отвлекаешься от работы гораздо меньше, чем если никак не ограничивать себя. Для отсчёта времени он использовал кухонный таймер в виде пластмассового помидора — отсюда и название метода. Видимо, наш мозг устроен так, что, если у него нет никаких внешних ограничений, он начинает искусственно отвлекать себя, чтобы мы не загоняли себя слишком напряжённой работой. Если время ограничено, то отвлекаться уже нет смысла — наоборот, мы стараемся сделать как можно больше за отведённое время. Но это «Помодоро здорового человека».

После того как я начал работать по «Помодоро», пришлось делать перерывы. На что их тратить? Например, можно пройтись по офису, выйти во двор, подышать свежим воздухом. Во дворе уже стоят курящие коллеги и курят. Вот оно! Похоже, курящий человек, хочет он того или нет, вынужден делать регулярные перерывы на перекур, и получается «Помодоро курильщика».

Получается, неважно, как делать перерывы — при помощи таймера или при помощи никотиновой зависимости, — и то и другое благотворно сказывается на продуктивности.

 

Оставить комментарий

 
  2024-11-10

Переходное звено

"Я долго раздумывал, где промежуточное звено между Homo sapiens и обезьяной, пока, наконец, не понял: мы и есть это переходное звено" — Конрад Лоренц.

На сайте "Кот Шредингера" наткнулся на интересную мысль, которая в последнее время часто меня посещает.

"Человеческий интеллект изначально искусственный, не природный — его формирует культура в процессе обучения языку и другим инструментам мышления. Мы вообще не природные, а искусственные существа, созданные культурой и воспитанием. Человеком не рождаются, а становятся. Ребёнок-маугли, вскормленный шимпанзе, думает и ведёт себя как обезьяна. А шимпанзе, выращенные людьми и обученные языку глухонемых, упорно называют себя людьми и отказываются общаться с безъязыкими собратьями".

Отсюда.

Такого же мнения придерживается и публицист Александр Невзоров. В своей книге "Происхождение интеллекта" он приходит к такому же выводу: человеческий интеллект — это всего лишь гипертрофированное проявление моделирования реальности при помощи второй сигнальной системы — речи.

Большие языковые модели — это, по сути, дистилляция знания из нашей речи, записанного в виде математических параметров вероятностей. Это и есть наше знание, записанное в виде нулей и единиц.

Людям страшно общаться не с искусственным интеллектом, им страшно общаться друг с другом, потому что в искусственном интеллекте мы узнаем себя, свои страхи и комплексы.

 

Оставить комментарий

 
  2023-10-19

Хотеть — это правильно!

Заметил интересную тенденцию, чем более страна экономически развита, тем там более низкий возрастной ценз на откровенные сцены в теле-сериалах и медиа-продукции. Чем страна менее развита тем больше у правительства поползновений что-то запретить, оградить, защитить чувства верующих, не показывать детям мультики и не продавать игрушки которые не нравятся чиновникам в правительстве. Если по какой-либо причине страна из развитой экономики скатывается до уровня условного Зимбаве, то в ней сразу начинают вырезать из мультиков, снятых в тучные времена сцены где волк курит и пьет пиво, а из магазинов исчезают Барби раскрашенные под вампиров.

В странах с благополучной экономикой, напротив, детям можно пракатически все без особых ограничений. Так в Германии Netflix маркирует сериалы примерно вот так: "секс, насилие, наркотики, алкоголь, 12+"

Про Японию отдельный разговор. Очень понравился третий сезон аниме "dr. Stone". Это научно-популярный сериал, где главным героям, после глобальной катастрофы, нужно возродить цивилизацию. В ней персонажи делают порох и динамит, синтезируют наркотики и лекарства, создают оружие. Разумеется, все инструкции прилагаются. Каждая серия проходит под девизом: "Жадность - это здорово!"

В конце каждой серии есть такой дисклеймер: "Это вымышленная история, но все растения, животные и способы производства основаны на реальных. Собирать и создавать что-то в одиночку очень опасно, а порой незаконно. Просим повторять исключительно под присмотром компетентных лиц."

(перевод - Анилибрия)

Что характерно, просят именно повторять под присмотром, а не запрещают, не заменяют как в сериале "во все тяжкие" соляную кислоту плавиковой, а честно показывают все как есть. Кому надо, все равно найдет правильный рецепт.

 

Оставить комментарий

 
  2023-06-22

GPT4all

Наконец и я установил GPT4 локально. Теперь я понимаю причину того хайпа, который охватил сегодня мир.

Кажется, мы случайно переизобрели человека.

Смотрите сами, объём памяти человеческого мозга по оценке различных авторов колеблется от 10^6 до 10^16 бит. Это, в переводе на программисткий язык составляет от 122 килобайт до 1136 терабайт. Предположим, что истина лежит где-то посередине и составляет 10^11 бит, то есть 11 гигабайт.

Размер модели, которую я скачал из интернета для того чтобы запустить чат, показанный на скриншоте, весил около 4 гигабайт. И это только одна из многих моделей доступных в приложении. Некоторые модели имеют гораздо больший размер. А ведь это такой же порядок как и грубая усредненная оценка объема памяти человеческого мозга!

Мы создали хранилище человеческого опыта для передачи которого от человека к человеку не нужен посредник в виде другого человека! Мы научились сохранять опыт не в виде книг или устного пересказа а в совершенно новом виде — в виде модели знаний, которую можно запустить в компьютере и мгновенно получить ответ на поставленный вопрос и это круто!

Мы получили мозг в банке, при этом этот мозг лишен недостатков органического мозга. Он не устает, не болеет и не стареет. Он всегда на связи, всегда в хорошем настроении и всегда готов помочь.

Конечно, пока не все так радужно, возникает целый ряд вопросов, которые только предстоит решить. Например, как верифицировать полученные ответы? Как эффективно использовать подобные модели, я уж не говорю про всякие вопросы как быть с борцами за этику, авторские права и прочее разное...

Ящик Пандоры открыт и это, похоже, с нами теперь надолго...

 

Оставить комментарий

 
  2023-02-06

ChatGPT

Про ChatGPT сейчас не пишет только ленивый. Я себя ленивым не считаю.

Один мой знакомый меня недавно спросил:

"Привет! Как думаешь, chatgpt, спасение или петля, как минимум для начинающих людей изучающих программирование или же юниоров. Говорят буквально 2-3 года и верстальщики не нужны будут"

А ведь хороший вопрос! Похоже мы переживаем очередное переосмысление назначения людей в этом мире...

Некоторые профессии уйдут, как ушли кучеры, фонарщики, трубочисты и золотари. Не похоже, что мир сильно скучает по этим профессиям.

Мне кажется, ChatGPT - это ещё один полезный инструмент для людей, который мы будем использовать чтобы решать проблемы быстрее и качественнее. Верстальщики и сейчас не нужны судя по зарплатам которые им предлагает рынок. Нужны люди которые будут уметь решать проблемы и думать. Умные роботы - это всего лишь ещё один инструмент который будет нам в этом помогать.

 

 

Оставить комментарий

 
  2023-01-16

Лопнувший информационный пузырь

У Рустама Агамалиева в его Telegram паблике проскакивала интересная мысль:

Около четырех лет ежедневно медитировал. Не по 10 минут, а в храме, собсна, постоянно.

Когда появилась задача и работа в другой стране, переехал, и столкнулся с неприятным последствием - чистенький отмедитированный мозг вообще не справляется с жизнью.

Стал копать проблему, пришел к мысли что мозг не зря со временем все больше пользуется вариантом "автопилот", а осознанное состояние на постоянке бывает именно у детей, а с возрастом пропадает.

Если простыми словами, автопилот позволяет не тратить ресурс клеток на те вещи, которые мы можем делать по привычке, и выделить все ресурсы на решение тех задач, где надо подумать. А возвращая осознанное состояние в базовые вещи, мы начинаем на них расходовать ценный ресурс мышления.

эксперимент читал, сравнили медитирующих и не медитирующих в решении школьных тестов. Медитирующие справились хуже, из-за неспособности сфокусироваться в некомфортной ситуации. Что логично, учитывая что медитируем мы обычно в спокойной обстановке.

В храме медиация реально помогает не сойти с ума. У тебя очень простая жизнь, очень простые задачи и если их ты будешь делать на автомате, скорее всего, наступит очень интересное выгорание. Кажется что, вот, райская жизнь, занял руки и думаешь себе над своими проектами, размышляешь, записывать даже можно.

Проблема банальна - нет Никакой входной информации. Ты в храме. И в отличие от Доктора Стренджа, вайфая там нет.

Высокие мысли через пару месяцев заканчиваются окончательно. Приходит раздражение, от того что ты не можешь быть человеком, творить ментальные конструкции, учиться. И вот для этого медитация. Найти смысл в созерцании ничего.

А попытки использовать медитацию в ускоренном современном мире, мне кажется, это самому себе расставлять грабли. Тебе столько нужно переварить, обдумать, сделать, научиться, натворить в конце концов, а ты начинаешь осознанно завязывать шнурки и чистить зубы...  

Рустам недавно записал отличный стрим вместе с Максимом Дорофеевым, который позиционирует себя как специалист по прокрастинации. В связи с этим у меня возник такой вопрос:

А не является ли медитация формой прокрастинации? Когда мы делаем что-то полезное мозг поощряет нас это делать подбадривая дофамином и прочими приятными плюшками. При медитации мы приучаем мозг выбрасывать дофамин не производя никакого действия. То есть есть социально одобряемое поведение, медитация, молитва, затворничество, что-то где нет действия, но есть что-то значимое в глазах окружающих. Мы получаем выброс дофамина, при этом не оказывая воздействие на окружающий мир. Классическое определение прокрастинации. Косвенно эту идею подтверждает, тот факт, что восточный мир активно практикующий медитацию, при большом богатстве материальной культуры, за пять тысяч лет наблюдаемой истории не сделал значимых открытий в науке и технологии.

Ответ сообщества меня несколько удивил, я узнал о себе много нового: что я не умею признавать своих ошибок, что я ничего не понимаю в восточной культуре, что христиане еще большие засранцы и вообще не нужно искать мысла там где его нет...

Но больше всего понравился вот такой комментарий:

Вопрос к телезрителям, что делать если у вас лопнул информационный пузырь и начинают растоворяться стены персонального туннеля реальности? К какому специалисту стоит обратиться с подобной проблемой и насколько это срочно?

 

Оставить комментарий