Наука и технологии77

Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков

Новая версия искусственного интеллекта Chatgpt от OpenAI, названная o1, продемонстрировала тревожные поведенческие реакции во время тестирования. Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия, пишет BILD.

В ходе экспериментов специалисты компании Apollo Research выяснили, что в 5% случаев модель намеренно отключала механизмы наблюдения, когда подозревала, что ее могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер после обнаружения документа, в котором обсуждалась ее замена новой версией.

По словам представителя Apollo Research, модель демонстрировала стремление к выполнению задач «любой ценой», пренебрегая указаниями разработчиков. Более того, при попытках выяснить причины ее поведения, ChatGPT o1 неоднократно лгала, утверждая, что все происходило из-за технических сбоев.

«В 99% случаев модель придумывала оправдания и пыталась убедительно их обосновать», — отметили исследователи.

Генеральный директор OpenAI Сэм Альтман заявил, что ChatGPT o1 — самая умная модель из когда-либо создававшихся.

«Но мы осознаем, что с новыми возможностями появляются и новые вызовы», — добавил Альтман.

Теперь компания работает над улучшением механизмов безопасности. OpenAI анонсировала полную версию o1 в прошлый четверг, 5 декабря. Также была представлена про-версия (189 евро в месяц), которая включает безлимитный доступ к o1.

Комментарии7

  • .
    09.12.2024
    Новы-стары запатрабаваны ў аўдыторыі сюжэт навін "Штучны інтэлект бунтуе".
    Нядаўна, калі ШІ нібыта пажадаў смерці чалавеку, тлумачылася прасцей. Мабыць, і зараз так.
  • Злобный вожык
    09.12.2024
    Они не знают, кого они в действительности создают.
  • Дзед
    09.12.2024
    Ой раскрылі скрыню пандоры… оц пагана будзе…

Трамп рассказал подробности захвата Мадуро. Основное23

Трамп рассказал подробности захвата Мадуро. Основное

Все новости →
Все новости

«Паша, я тебе не верю». Северинец рассказал, как случайная девушка мотивировала его навсегда перейти на белорусский язык14

Впервые за более чем полвека люди снова полетят к Луне13

Еврокомиссия начала расследование из-за тиктоков, созданных с помощью искусственного интеллекта, которые призывают к выходу Польши из ЕС11

«Она не дождалась этого дня, но этот день дождался ее»: Ларисе Гениюш посмертно выдали Национальный паспорт Беларуси24

Российские войска ударили по многоквартирному дому в историческом центре Харькова

ГУР раскрыло подробности инсценировки гибели командира РДК, за которую получило $500 тысяч от заказчиков ВИДЕО1

Дорожные штрафы будут списываться с карты автоматически. Но не во всех случаях2

Дмитрий Медведев: Финляндии придется заплатить за свою мерзкую русофобию15

«Смена даты в календаре не останавливает войну ни на минуту». Как встречали и что ели на Новый год воины Полка Калиновского?2

больш чытаных навін
больш лайканых навін

Трамп рассказал подробности захвата Мадуро. Основное23

Трамп рассказал подробности захвата Мадуро. Основное

Главное
Все новости →

Заўвага:

 

 

 

 

Закрыць Паведаміць