Одна из нейросетей успешно прошла тест Тьюринга. Это происходит впервые в истории
Ученые из Калифорнийского университета провели для нескольких нейросетей настоящий тест Тьюринга и дали им пообщаться с 500 разными людьми, которые потом должны были ответить, с человеком или с машиной они разговаривали. Результаты оказались судьбоносными для всего человечества, говорят исследователи.
15.06.2024 / 18:54
Иллюстративное изображение. Фото: vecteezy
Команда ученых из Калифорнийского университета недавно провела всемирно известный тест Тьюринга с целью выяснить, могут ли современные модели искусственного интеллекта (ИИ) правдоподобно имитировать человеческое общение и скольких людей удастся ввести в заблуждение, дав им пообщаться с ИИ, пишет журнал Life Science.
Для этого ученые устроили поочередную 5-минутную беседу нескольких нейросетей с 500 разными людьми, которых разделили на 4 группы: первая общалась с настоящим человеком, а три остальные — с нейросетями (в эксперименте испытывали самый первый в истории человечества чат-бот ELIZA, а также третью и четвертую версии нейросети ChatGPT).
Согласно правилам теста Тьюринга, ни один из 500 респондентов изначально не знал, с кем он ведет разговор: с машиной или с живым человеком. Потом каждый из участников должен был ответить на вопрос, был ли их собеседник настоящим.
Результаты оказались такие: ChatGPT-4 во время разговора сумел убедить 54% участников в том, что с ними общался живой человек. А третью версию нейросети (ChatGPT-3.5) приняли за человека 50% респондентов.
Чат-бот ELIZA в свою очередь завалил тест, и 78% участников сразу определили, что с ними беседует машина. Реальный человек, который вместе с нейросетями общался с респондентами, смог убедить в своей человечности 67% участников.
«Поскольку 54% — это большинство, и оно не смогла отличить машину от живого человека, то ChatGPT прошел тест Тьюринга. Это происходит впервые», — заявили ученые из Калифорнийского университета в своем новом исследовании.
Они также признают, что оригинальный тест Тьюринга слишком упрощен в своем подходе, «поскольку стилистические и социально-эмоциональные факторы сегодня играют большую роль в прохождении теста, чем традиционные понятия интеллекта».
«Современные языковые модели бесконечно гибкие, они способны синтезировать ответы на широкий спектр тем, высказываться на разных языках и диалектах, примерять на себя характерные личностные качества и ценности, а также обманывать и манипулировать.
Это огромный шаг вперед и показатель того, как сильно изменился ИИ в эпоху GPT. Это большой вызов будущему взаимодействию человека и машины, который может принести за собой широкомасштабные социальные и экономические последствия для всего человечества», — подчеркивают ученые.
Полный текст исследования (на английском языке) можно посмотреть по ссылке.
Напомним, что тест Тьюринга назван в честь британского математика и криптографа Алана Тьюринга, которому во время Второй мировой войны удалось взломать секретную немецкую шифровальную машину «Энигма» и тем самым отслеживать операции подводного флота Германии, что существенно помогло союзникам победить в войне.
Тьюринг также считается одним из основателей теории искусственного интеллекта, и его тест должен был определять уровень наличия интеллекта у машин на основе их способности поддерживать правдоподобный разговор с человеком.
Алан Тьюринг — гениальный математик, взломщик нацистских шифров и гей — помилован посмертно
Чат-боты могут поддерживать нацизм и другие античеловеческие идеологии из-за одной особенности