Одна из нейросетей успешно прошла тест Тьюринга. Это происходит впервые в истории

Ученые из Калифорнийского университета провели для нескольких нейросетей настоящий тест Тьюринга и дали им пообщаться с 500 разными людьми, которые потом должны были ответить, с человеком или с машиной они разговаривали. Результаты оказались судьбоносными для всего человечества, говорят исследователи.

15.06.2024 / 18:54

Иллюстративное изображение. Фото: vecteezy

Команда ученых из Калифорнийского университета недавно провела всемирно известный тест Тьюринга с целью выяснить, могут ли современные модели искусственного интеллекта (ИИ) правдоподобно имитировать человеческое общение и скольких людей удастся ввести в заблуждение, дав им пообщаться с ИИ, пишет журнал Life Science.

Для этого ученые устроили поочередную 5-минутную беседу нескольких нейросетей с 500 разными людьми, которых разделили на 4 группы: первая общалась с настоящим человеком, а три остальные — с нейросетями (в эксперименте испытывали самый первый в истории человечества чат-бот ELIZA, а также третью и четвертую версии нейросети ChatGPT).

Согласно правилам теста Тьюринга, ни один из 500 респондентов изначально не знал, с кем он ведет разговор: с машиной или с живым человеком. Потом каждый из участников должен был ответить на вопрос, был ли их собеседник настоящим.

Результаты оказались такие: ChatGPT-4 во время разговора сумел убедить 54% участников в том, что с ними общался живой человек. А третью версию нейросети (ChatGPT-3.5) приняли за человека 50% респондентов.

Чат-бот ELIZA в свою очередь завалил тест, и 78% участников сразу определили, что с ними беседует машина. Реальный человек, который вместе с нейросетями общался с респондентами, смог убедить в своей человечности 67% участников.

«Поскольку 54% — это большинство, и оно не смогла отличить машину от живого человека, то ChatGPT прошел тест Тьюринга. Это происходит впервые», — заявили ученые из Калифорнийского университета в своем новом исследовании.

Они также признают, что оригинальный тест Тьюринга слишком упрощен в своем подходе, «поскольку стилистические и социально-эмоциональные факторы сегодня играют большую роль в прохождении теста, чем традиционные понятия интеллекта».

«Современные языковые модели бесконечно гибкие, они способны синтезировать ответы на широкий спектр тем, высказываться на разных языках и диалектах, примерять на себя характерные личностные качества и ценности, а также обманывать и манипулировать.

Это огромный шаг вперед и показатель того, как сильно изменился ИИ в эпоху GPT. Это большой вызов будущему взаимодействию человека и машины, который может принести за собой широкомасштабные социальные и экономические последствия для всего человечества», — подчеркивают ученые.

Полный текст исследования (на английском языке) можно посмотреть по ссылке.

Напомним, что тест Тьюринга назван в честь британского математика и криптографа Алана Тьюринга, которому во время Второй мировой войны удалось взломать секретную немецкую шифровальную машину «Энигма» и тем самым отслеживать операции подводного флота Германии, что существенно помогло союзникам победить в войне.

Тьюринг также считается одним из основателей теории искусственного интеллекта, и его тест должен был определять уровень наличия интеллекта у машин на основе их способности поддерживать правдоподобный разговор с человеком.

Алан Тьюринг — гениальный математик, взломщик нацистских шифров и гей — помилован посмертно

Чат-боты могут поддерживать нацизм и другие античеловеческие идеологии из-за одной особенности

Кого считать президентом Беларуси и какая сгущенка лучше? Протестировали ChatGPT-4 Omni — нашумевшую версию популярной нейросети

Nashaniva.com