Ответ Google на GPT-4: ИИ-модель Gemini позиционируется как «самая способная модель, которую мы когда-либо создавали»
Компания планирует включить новую модель искусственного интеллекта во все свои продукты, начиная с чат-бота Bard.
20.12.2023 / 23:10
Файл: Google
Гегемония компании OpenAI в сфере генеративного искусственного интеллекта, возможно, подходит к завершению. В начале декабря Google официально представил свою самую способную на сегодня языковую модель под названием Gemini 1.0, которая позиционируется как первая из «нового поколения моделей ИИ, вдохновленных тем, как люди понимают мир и взаимодействуют с ним».
Во время презентации было сказано много громких слов обо всех передовых «наворотах», которые, по словам представителей компании, делают Gemini «самой современной ИИ-моделью почти во всех сферах». Система была разработана как «интегрированный мультимодальный искусственный интеллект».
Многие сегодняшние ИИ-модели могут состоять из групп меньших моделей, причем каждая отдельная модель обучена выполнять свою специфическую функцию как часть большего целого. Все это хорошо для «неглубоких» функций (например, для описания изображений), но не очень хорошо подходит для сложных задач мышления.
Gemini же была с самого начала обучена и настроена на «разных модальностях», что позволило модели «плавно понимать и рассуждать о всех видах входных данных с нуля, гораздо лучше, чем имеющиеся мультимодальные модели», передает слова представителей Google издание Engaget. Возможность принимать различные формы данных одновременно должна помочь Gemini давать лучшие ответы на более сложные темы, например, физики.
Заявляется также, что Gemini умеет кодировать: модель владеет популярными языками программирования, включая Python, Java, C++ и Go. Google даже использовал специализированную версию Gemini для создания AlphaCode 2, преемника прошлогоднего генеративного ИИ, победившего в специализированном конкурсе. Как утверждают в компании, AlphaCode 2 решил вдвое больше проблемных вопросов, чем его предшественник, что повысило его производительность более чем на 85 процентов по сравнению с другими участниками конкурса.
Хотя Google не сразу поделился количеством параметров, которые Gemini может использовать, компания рекламировала операционную гибкость модели и способность работать в различных форм-факторах: от больших центров обработки данных до локальных мобильных устройств. С этой целью Gemini выпускается в трех размерах: Nano, Pro и Ultra.
Nano является самой маленькой из трио и предназначена в основном для задач на устройствах. Версия Pro — более универсальное и способное предложение — вскоре будет интегрирована во многие из имеющихся продуктов Google, в том числе в чат-бот Bard. Вскоре Bard начнет использовать специально настроенную версию Gemini Pro, которая, как обещает компания, будет предлагать «более продвинутые рассуждения, планирование, понимание и многое другое».
В следующем году, с выпуском Gemini Ultra, Google также представит Bard Advanced — еще более сильный ИИ с дополнительными функциями. Ultra не будет доступен по крайней мере до 2024 года, поскольку требуется дополнительное тестирование. Но когда он появится, Ultra обещает стать невероятно мощным для дальнейшего развития ИИ, обещает компания.
Читайте также:
Google дает своему ИИ возможность создавать и отлаживать код
Искусственный интеллект: как Google планирует перехватить лидерство в этой области
Искусственный интеллект в офисе не добавляет работникам счастья