«Дальше будет только больше». Белорус-разработчик в области ИИ, который работает в Нью-Йорке, рассказал, что нас ждет

Андрей Храповицкий родом из Глубокого, учился в Полоцке, а сейчас работает в США — уже 6 лет в области искусственного интеллекта и больших данных. В своей статье, написанной для «Нашай Нівы», он рассказывает, что нас ждет в ближайшие несколько лет, и советует, какие книги и эссе стоит почитать на эту тему.

14.12.2024 / 14:08

Андрей Храповицкий. Фото из социальных сетей

Представь себе будущее. Ты живешь в мире, где изобретены лекарства от болезней, которые еще пару лет назад считались неизлечимыми. Длительность твоей жизни значительно превышает 100 лет. Уже никто не поздравляет «100 lat!». Такое поздравление сравнимо с чем-то вроде «Чтоб ты сдох!».

Ты работаешь не для того, чтобы заработать на хлеб, а потому что тебе интересно то, что ты делаешь. Если же тебе ничего не интересно, не работай на здоровье, но бесплатные деньги все равно будут поступать тебе на счет.

В твоем доме есть робот. Минимум один, возможно, несколько. Он выполняет за тебя рутинные обязанности. С ним ты можешь поговорить на любые темы. Он помнит твои привычки и предпочтения. Не буду углубляться в подробности, что еще можно делать с роботом. Додумай в меру своей испорченности.

Игры, в которые ты играешь, настолько реалистичны, что иногда трудно отличить виртуальный мир от реального. Может, не совсем WestWorld, но хочешь в фотореалистичный ВКЛ времен Витовта? Пожалуйста!

Космические интеллектуальные зонды исследуют миры за пределами нашей солнечной системы, а автоматизированные космические корабли добывают полезные ископаемые с астероидов.

Это и многое другое можно себе представить, если развитие искусственного интеллекта пойдет по позитивному сценарию. Не буду реитерировать оптимистичные прогнозы Курцвейля и других футуристов. Но советую эссе Дарио Амадеи, генерального директора компании Anthropic «Машины любящей ласки» (Machines of Loving Grace), где он описывает ряд реалистичных изменений к лучшему, которые может дать общий искусственный интеллект в течение ближайших ста лет.

Прорыв в сфере языковых моделей

Я начал работать в области искусственного интеллекта (ИИ) примерно шесть лет назад. Фактически, с самого начала я работал с языковыми моделями и в частности с трансформерами (алгоритмической архитектурой, которая стоит за чатом GPT).

Андрей Храповицкий. Фото из социальных сетей

И мог видеть их потенциал. Тогда, когда я начинал, наибольший хайп создавали модели обучения с подкреплением (reinforcement learning или RL), которые побеждали чемпионов мира по го, шахматам, шоги и другим играм. Уже тогда казалось, что прорывом в сфере будет интеграция трансформеров с подходами обучения с подкреплением. Но в тот момент исследовательским компаниям не хватало качественного «железа», соответствующих данных для обучения и банально инвестиций. 

Еще в 2019 году отец области обучения с подкреплением Ричард Саттон написал эссе «Горькая наука», в котором подтвердил, что самая большая наука, которую можно вынести из 70-летних исследований искусственного интеллекта, заключается в том, что общие методы, которые масштабируют вычисления, в конечном итоге оказываются наиболее эффективными и с большим отрывом. 

Именно этим путем пошла компания OpenAI, масштабируя вычисления (то есть используя все больше и больше компьютерных мощностей для тренировки своих нейронных сетей, используя больше и больше данных, тренируя модели дольше), а также изобретя подход, который назвали обучением с подкреплением на основе человеческой обратной связи (RLHF), где используется фидбэк людей для улучшения ответов, которые генерируют языковые модели. Это и стало секретным соусом чата GPT и быстро было перенято другими крупными игроками в отрасли. 

Появление в массы чата GPT стало тем моментом, когда множество людей почувствовали, что ИИ — это не какая-то мало полезная в жизни сущность, а это довольно полезный инструмент, с которым нам придется взаимодействовать в дальнейшем.

Между хайпом и реальностью

Мы живем в необычное время. Во-первых, мы сталкиваемся со шквалом хайпа на тему ИИ, как со стороны больших компаний или даже стартапов в сфере, так и технооптимистов, которые религиозно верят в положительное будущее, которое вот-вот наступит. 

Во-вторых, у нас есть техно-думеры, которые бьют тревогу по поводу опасностей ИИ. Плохих сценариев море. От автономных дронов, которые будут уничтожать цели через распознавание лиц, и искусственных вирусов, которых разнообразные террористические структуры смогут разработать с помощью ИИ, до потери работы, смысла жизни миллионами людей, или в наиболее экстремальных версиях до уничтожения цивилизации.

В-третьих, у нас есть скептики, такие как Гари Маркус и другие, которые пытаются остудить хайп и обратить внимание на целую массу нерешенных, возможно неразрешимых, как они считают, проблем: галлюцинаций больших языковых моделей, неумения искусственных агентов обучаться на небольшом количестве примеров, недостатков алгоритмов ИИ и т.д.

Необычность нашего цайтгайста в том, что определенную правоту имеют как технооптимисты, так и скептики, так и многие интеллектуалы, обеспокоенные гонкой без тормозов, которая наблюдается в техиндустрии. Точно определить, кто прав, сложно. Но где многие голоса, как оптимистичные, так и пессимистичные, сливаются в унисон, так это в обеспокоенности, что ни нынешние политики, ни общество фактически никакой страны мира не готовы к приходу общего искусственного интеллекта, тем более к появлению искусственного сверхинтеллекта.

Остановлюсь на этих терминах.

Общий искусственный интеллект (AGI) — это когда система/модель ИИ может понимать, изучать и применять знания в широком диапазоне задач и сфер.

Искусственный сверхинтеллект — это когда общая система ИИ имеет интеллект, который [значительно] превышает человеческий интеллект.

Где мы находимся сейчас?

В сети уже какое-то время циркулирует (обращаю внимание — официально неподтвержденный) внутренний план, дорожная карта компании OpenAI на пути к AGI. План этот имеет 5 основных этапов. 

1. Чат-боты с разговорным языком: примерами здесь могут быть, как GPT-4 и GPT-3.5 так и многие другие большие языковые модели. Эти системы способны поддерживать связные диалоги с пользователями на естественном языке.

2. «Думающие» системы со способностью решать задачи на уровне человека: OpenAI считает, что находится на пороге достижения этого уровня. Такие системы смогут решать базовые проблемы не хуже, чем человек с докторской степенью, не имея доступа к внешним инструментам. Из публично доступных систем с большими оговорками в эту категорию мы можем отнести модель o1 и ряд других, которые натренированы давать ответ не сразу, подходят к проблеме пошагово, что во многих случаях обеспечивает лучшие результаты, особенно в математических, научных задачах, которые раньше давались ИИ с трудом и которые требуют более долгих логических рассуждений или многоэтапных вычислений.

3. Агенты: системы, которые могут самостоятельно действовать от имени пользователя. Такие модели ИИ смогут выполнять многоуровневые задачи, которые требуют принятия решений, с минимальным привлечением человека.

4. Новаторы: модели ИИ, способные помочь в открытиях и потенциально внести вклад в исследование самого ИИ. На этом уровне роль ИИ значительно расширяется от простого выполнения указаний до активного участия в инновационной деятельности.

5. Системы ИИ, способные выполнять работу целой организации, включая принятие стратегических решений и оптимизацию процессов в масштабах всей компании. Здесь ИИ становится неотъемлемой частью функционирования бизнеса.

Сколько времени займет пройти все этапы и какая компания будет первой, не знает никто, но если исходить из этой дорожной карты, общий искусственный интеллект инсайдерам в сфере не кажется чем-то фантастическим и нереалистичным. С определенной долей вероятности этапы 2-3 могут быть преодолены уже в ближайший год. С этапами 4 и 5 таймфрейм может быть дольше, и, скорее всего, потребуются новые алгоритмические подходы. 

Уже сейчас есть многообещающие направления исследований, которые могут привести к исправлению недостатков нынешних систем. Как и не прекращается поток инвестиций в «железо», необходимое для тренировки и выпуска в мир дорогих систем ИИ. Показательно также то, что ряд компаний, например Meta, Alibaba и других, готовы опенсорсить, то есть делиться кодом новейших продвинутых моделей, еще больше ускоряя исследовательскую работу. 

Что нас ждет в ближайшее время? В следующем году мы увидим искусственных агентов, которые будут иметь гораздо лучшую «память» в отличие от тех систем, которые забывают контекст предыдущих бесед. Увидим большой прогресс в бизнес-ориентированных многоагентских системах, где ряд искусственных агентов взаимодействуют друг с другом для достижения определенных целей. Увидим также прогресс в мультимодальных системах, которые работают как с текстом, так и с фото и видео. 

Нет гарантии, что даже достигнув этапа 5 в (неофициальном) плане OpenAI, мы получим искусственный сверхинтеллект в том виде, в каком его описывали Ник Бостром в своей нашумевшей книге «Сверхинтеллект» или Макс Тэгмарк в книге «Жизнь 3.0». По крайней мере пока что. Результаты могут быть куда более приземленными. Но даже эти более приземленные системы ИИ будут настолько продвинутыми и практически полезными для бизнеса и обычных людей, что их приход в широкий обиход бесспорно изменит наш мир в самых различных аспектах. 

К сожалению, мы к этому не готовы даже близко. Наблюдая за политическим дискурсом, беспокоит фундаментальное непонимание тех вызовов, которые стоят перед человечеством. 

Фото из социальных сетей

Пугает то, что мы не готовы даже к тем системам ИИ, которые у нас уже сегодня. Уже сейчас мы видим попытки использования дипфейков — обманного контента, сгенерированного с помощью ИИ, в политических и маркетинговых кампаниях, на сайтах вроде OnlyFans и т.д.. Уже сейчас алгоритмы ИИ определяют, что мы видим в поисковиках, лентах социальных сетей. Учителя уже сейчас сталкиваются с проблемой, как оценивать домашние задания учеников, ведь не секрет, что многие из них пользуются чатом GPT, Клодом, Perplexity и т.д. Уже сейчас ИИ может писать программы не хуже, а в многих случаях лучше, чем программисты (даже не новички), а также служат ежедневными помощниками разработчикам фактически в любой компании, которая не хочет остаться далеко позади и быть растоптанной конкурентами. 

За последнее время мы видели массовые увольнения в некоторых крупных компаниях. Руководители говорили о повышении эффективности работы и уменьшении расходов. Редко кто признает, но фактом является то, что несколько человек с доступом к этим новым умным помощникам могут делать ту же самую работу, которую выполняли большие команды. И чем дальше, тем такого будет больше.

Как кто-то сказал, «ИИ не лишит вас работы. Это сделает человек, который использует ИИ». 

С другой стороны, многие страны мира, в том числе Беларусь, стоят на пороге демографической ямы. Если ситуация с рождаемостью не исправится, в условиях стареющего населения ничего не останется, как меньшему количеству работающих людей выполнять свою работу более эффективно. И здесь роботы и системы ИИ будут играть незаменимую роль для удержания огромного количества неработающих и людей пенсионного возраста.

Прогнозировать будущее неблагодарное дело. Даже если очертания этого будущего вырисовываются уже сегодня. Независимо от того, где вы находитесь. Искусственный интеллект уже стал частью нашей жизни. Дальше будет только больше.

Nashaniva.com