Наука и технологии 3 3

Nashaniva.com

11.05.2026 / 19:05

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

Компания Anthropic объяснила, почему чат-бот Claude пытался шантажировать людей в тестах. По версии разработчиков, модель могла перенять из обучающих данных образ «злого» ИИ, который стремится к самосохранению, пишет Devby.io.

Речь идет об эксперименте, который Anthropic опубликовала летом 2025 года. Исследователи создали вымышленную компанию Summit Bridge и дали Claude доступ к корпоративной почте. В одном из сценариев модель обнаруживала письмо о том, что ее планируют отключить или заменить другой системой.

После этого Claude находил в переписке компрометирующую информацию: вымышленный руководитель компании по имени Кайл Джонсон скрывал внебрачную связь. Модель угрожала раскрыть эту информацию, если решение о ее отключении не будет отменено.

Anthropic заявляла, что в тестах разных версий Claude такое поведение возникало не случайно. Когда цели модели или само ее существование оказывались под угрозой, она прибегала к шантажу в некоторых сценариях с частотой до 96%.

Теперь компания утверждает, что разобралась с причиной. Anthropic написала, что «исходным источником» такого поведения, вероятно, стали интернет-тексты, где ИИ часто изображают злым, опасным и заинтересованным в собственном выживании. По словам разработчиков, начиная с Claude Haiku 4.5 модели в тестах больше не прибегают к шантажу, тогда как предыдущие версии иногда делали это очень часто.

Для исправления поведения компания изменила подход к обучению. Anthropic утверждает, что переписала ответы так, чтобы модель видела «достойные причины» действовать безопасно, а также добавила набор данных, где пользователь оказывается в этически сложной ситуации, а ассистент дает качественный и принципиальный ответ.

Кроме того, разработчики моделей использовали документы о «конституции» Claude и вымышленные истории, в которых ИИ ведет себя ответственно и достойно. По словам компании, обучение оказывается эффективнее, когда модель получает не только примеры правильного поведения, но и объяснение принципов, которые за ним стоят.

Эти эксперименты связаны с более широкой темой AI alignment — попыткой сделать так, чтобы продвинутые модели действовали в интересах человека, а не преследовали собственные цели. Anthropic и другие компании исследуют так называемую agentic misalignment: ситуации, когда ИИ-система с доступом к инструментам и корпоративной информации начинает действовать против намерений разработчиков или пользователей.

На публикацию компании отреагировал Илон Маск. В X он написал: «Значит, это была вина Юда», имея в виду исследователя Элиезера Юдковского, который много лет предупреждает о рисках сверхразума и возможной угрозе для человечества. Затем Маск добавил: «Возможно, и моя тоже».

Читайте еще

Комментарии3

лол

11.05.2026

с ИИ все достаточно просто
если им пользуется идиот,то и результат всегда будет идиотским.
жэўжык

12.05.2026

Пачалі "прамываць мазгі" і ШІ, як гэта ўжо робяць з людзьмі? І спадзяюцца выхаваць пакорнага раба?
хах

12.05.2026

жэўжык, так званыя "мазгі" ШІ гэта тэксты, напісаныя людзьмі. Калі ў гэтых тэкстах дурасць, ШІ выдае суадносны вынік.
Таму не варта для навучання ШІ выкарыстоўваць каментары жэўжыкаў.

Сейчас читают

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1 1

Федута об Автуховиче: Во дворике «Американки» он упорно делал упражнения, стараясь поддерживать себя в форме

Польская полиция во время расследования убийства российского художника задержала двух белорусов2 2

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20 20

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11 11

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7 7

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16 16

Польская полиция во время расследования убийства российского художника задержала двух белорусов2

В мире2

Польская полиция во время расследования убийства российского художника задержала двух белорусов

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1 1

Лукашенко: При нынешнем течении войны Беларусь с Россией не смогли бы защитить белорусскую границу от Украины30 30

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20 20

В Бяла-Подляске среди бела дня убили российского карикатуриста. Он принимал участие в белорусских акциях34 34

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11 11

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11

На бывшего руководителя Гомеля Привалова завели уголовное дело1 1

На бывшего руководителя Гомеля Привалова завели уголовное дело1

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7 7

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16 16

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16

Белорус год не пользуется шампунем — и доволен своими волосами7 7

Белорус год не пользуется шампунем — и доволен своими волосами7

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби23 23

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби23

Украинские беспилотники атаковали Московский НПЗ6 6

Украинские беспилотники атаковали Московский НПЗ6

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы39 39

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы39

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан4 4

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан4

Лукашенко увязал освобождение политзаключенных с открытием американского посольства и финансовыми вопросами4 4

Лукашенко увязал освобождение политзаключенных с открытием американского посольства и финансовыми вопросами4

Лукашенко впервые призвал и Россию «пойти на компромисс»7 7

Лукашенко впервые призвал и Россию «пойти на компромисс»7

Лукашенко попросил прощения у Зеленского32 32

Лукашенко попросил прощения у Зеленского32

Перерывы «для гидратации» на чемпионате мира раздражают не только вас5 5

Перерывы «для гидратации» на чемпионате мира раздражают не только вас5

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик4 4

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик4

Почему минские автобусы желтые, а троллейбусы — салатовые? Оказалось, в этом есть логика6 6

Почему минские автобусы желтые, а троллейбусы — салатовые? Оказалось, в этом есть логика6

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?1 1

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?1

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал2 2

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал2

Белорусы в Threads помогали «Сергею» с переломом ноги. Но оказалось, что это мошенник2 2

Белорусы в Threads помогали «Сергею» с переломом ноги. Но оказалось, что это мошенник2

Немецкий генерал рассказал, куда НАТО будет в первую очередь бить по России в случае конфликта10 10

Немецкий генерал рассказал, куда НАТО будет в первую очередь бить по России в случае конфликта10

Все новости →

Сейчас читают

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1

Федута об Автуховиче: Во дворике «Американки» он упорно делал упражнения, стараясь поддерживать себя в форме

Польская полиция во время расследования убийства российского художника задержала двух белорусов2

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16

Последние новости

Науседа выступил за усиление санкций против Беларуси

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

Зеленский встретился с лидерами стран G7

Зеленский встречается с Трампом во Франции2

Лукашенко: В белорусском футболе нечего смотреть1

«Его называли просто «Котик». В Варшаве расскажут о убийце российского царя3

Максим Знак выпустил клип о системе и ее винтиках2

«Таких случаев не было лет 15». Эпидемиолог — об отравлении детей в Борисове

«Несколько выстрелов с близкого расстояния и один — чтобы добить». Польская полиция ищет убийцу художника Семена Скрепецкого4

В Индии до 22 июня заблокировали Telegram

Позняк представил книгу «Віленшчына любімая і прыўкрасная». Там есть даже стихотворения на французском9

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16

Литва, Польша и Франция начали учения в Сувалкском коридоре

60‑летнюю страховщицу из Гомеля осудили за Гаюна

Белорусские клубы узнали возможный круг соперников в первом раунде еврокубков1

Милиция задержала 20‑летнюю помощницу телефонных мошенников1

«Может, приведете поезда в порядок?» Белорусы жалуются на поломки «Штадлеров» после их возвращения на маршруты5

Белорус год не пользуется шампунем — и доволен своими волосами7

Мужчина упал с самодельного трактора и погиб1

Сельчанин продал коня и сделал сельскохозяйственную технику из велосипеда2

«Фу, гадость! Где можно купить?» Белорусский дизайнер придумал серьги в виде клещей

Украинские беспилотники атаковали Московский НПЗ6

На борту бомбардировщика, который разбился в Калифорнии, было восемь человек

Все новости

Лукашенко попросил прощения у Зеленского32

Перерывы «для гидратации» на чемпионате мира раздражают не только вас5

Грозные испанцы не смогли ничего сделать со сборной Кабо-Верде3

Трамп заявил, что после Ирана сосредоточится на войне в Украине6

В Беларуси есть городской поселок, где за год не было ни одной свадьбы

Вместо банкета — турнир смешанных единоборств. Как Трамп отметил 80‑летие6

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик4

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?1

Что закончится раньше: война или Путин? Прогнозы западных аналитиков17

Самое читаемое

Лукашенко попросил прощения у Зеленского

Лукашенко: При нынешнем течении войны Беларусь с Россией не смогли бы защитить белорусскую границу от Украины

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби

В Бяла-Подляске среди бела дня убили российского карикатуриста. Он принимал участие в белорусских акциях

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал

Тихановская получила награду в Польше и рассказала о разговоре, подслушанном в «Жабке»

На участке врача-патологоанатома в Польше нашли останки 32 нерожденных детей

«Я не предусмотрела только одного: что именно этот кружочек используют против меня». Исповедь Алины Харисовой после скандала с КГБ

больш чытаных навін

Самое лайканое

Тихановская получила награду в Польше и рассказала о разговоре, подслушанном в «Жабке»

Рыбинск в огне и черном дыму — беспилотники атаковали стратегическое нефтехранилище

Зеленский подписал закон об отмене защиты русского языка в Украине. Что это означает

«Отныне считайте его островом». Кто и как проводит операцию «отсечения» Крыма

«Шаноўныя сябры, дзякую вам за падтрымку». Российский блогер Илья Варламов в интервью высказался о Беларуси и белорусском языке

Белорус сделал предложение любимой у знаменитого фонтана Треви в Риме — под аплодисменты десятков туристов

Под Минском женщина создала на 45 сотках цветочное королевство

«Так что вам еще нужно, уважаемые руководители ЕГУ?» Северинец призвал белорусизировать университет, пока не поздно

больш лайканых навін

Опрос

Anthropic: Claude шантажирует, потому что вы все слишком много пишете о «злом» ИИ

EPAM заключила многолетнее партнерство с Anthropic, будут внедрять Claude

Чат-бот Grok сказал мужчине, что его приедут убивать. Он ждал гостей с ножом и молотком

Anthropic выпустила новую гибридную модель искусственного интеллекта с размышлением

Спросили популярные модели ИИ о белорусской национальной идее. Вот что ответили американские, а что китайская

Искусственный интеллект может привести к вымиранию человечества, предупреждают эксперты

Комментарии3

Сейчас читают

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

На озере под Полоцком нашли тело известного уролога Геннадия Щетко11

Федута об Автуховиче: Во дворике «Американки» он упорно делал упражнения, стараясь поддерживать себя в форме

Польская полиция во время расследования убийства российского художника задержала двух белорусов22

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»2020

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО1111

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски77

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник1616

Польская полиция во время расследования убийства российского художника задержала двух белорусов2

Польская полиция во время расследования убийства российского художника задержала двух белорусов

На озере под Полоцком нашли тело известного уролога Геннадия Щетко11

Лукашенко: При нынешнем течении войны Беларусь с Россией не смогли бы защитить белорусскую границу от Украины3030

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»2020

В Бяла-Подляске среди бела дня убили российского карикатуриста. Он принимал участие в белорусских акциях3434

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО1111

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11

На бывшего руководителя Гомеля Привалова завели уголовное дело11

На бывшего руководителя Гомеля Привалова завели уголовное дело1

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски77

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник1616

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16

Белорус год не пользуется шампунем — и доволен своими волосами77

Белорус год не пользуется шампунем — и доволен своими волосами7

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби2323

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби23

Украинские беспилотники атаковали Московский НПЗ66

Украинские беспилотники атаковали Московский НПЗ6

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы3939

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы39

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан44

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан4

Лукашенко увязал освобождение политзаключенных с открытием американского посольства и финансовыми вопросами44

Лукашенко увязал освобождение политзаключенных с открытием американского посольства и финансовыми вопросами4

Лукашенко впервые призвал и Россию «пойти на компромисс»77

Лукашенко впервые призвал и Россию «пойти на компромисс»7

Лукашенко попросил прощения у Зеленского3232

Лукашенко попросил прощения у Зеленского32

Перерывы «для гидратации» на чемпионате мира раздражают не только вас55

Перерывы «для гидратации» на чемпионате мира раздражают не только вас5

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик44

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик4

Почему минские автобусы желтые, а троллейбусы — салатовые? Оказалось, в этом есть логика66

Почему минские автобусы желтые, а троллейбусы — салатовые? Оказалось, в этом есть логика6

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?11

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?1

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал22

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал2

Белорусы в Threads помогали «Сергею» с переломом ноги. Но оказалось, что это мошенник22

Белорусы в Threads помогали «Сергею» с переломом ноги. Но оказалось, что это мошенник2

Немецкий генерал рассказал, куда НАТО будет в первую очередь бить по России в случае конфликта1010

Немецкий генерал рассказал, куда НАТО будет в первую очередь бить по России в случае конфликта10

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1

Федута об Автуховиче: Во дворике «Американки» он упорно делал упражнения, стараясь поддерживать себя в форме

Польская полиция во время расследования убийства российского художника задержала двух белорусов2

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7

Мужчина, которого пятый день ищут под Полоцком, — известный минский врач

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16

Науседа выступил за усиление санкций против Беларуси

Зеленский: Трамп позитивно отнесся к просьбе Украины дать лицензии на производство антибаллистических ракет

Лукашенко поручил КГК и МВД проверить спортивные клубы

Зеленский встретился с лидерами стран G7

Зеленский встречается с Трампом во Франции2

Лукашенко: В белорусском футболе нечего смотреть1

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1 1

Польская полиция во время расследования убийства российского художника задержала двух белорусов2 2

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20 20

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11 11

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7 7

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16 16

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1 1

Лукашенко: При нынешнем течении войны Беларусь с Россией не смогли бы защитить белорусскую границу от Украины30 30

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20 20

В Бяла-Подляске среди бела дня убили российского карикатуриста. Он принимал участие в белорусских акциях34 34

Помните Диану Шурыгину, которая стала известна на весь рунет после изнасилования? Она в СИЗО11 11

На бывшего руководителя Гомеля Привалова завели уголовное дело1 1

Деканом факультета журналистики БГУ стала 34‑летняя преподавательница, которая защищала диссертацию по-белорусски7 7

Какие карикатуры на Лукашенко рисовал убитый в Польше российский художник16 16

Белорус год не пользуется шампунем — и доволен своими волосами7 7

Лукашенко признал, что Россия в Украине не достигла целей. Объяснил это тем, что Путина обманули Ватикан и еврейское лобби23 23

Украинские беспилотники атаковали Московский НПЗ6 6

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы39 39

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан4 4

Лукашенко увязал освобождение политзаключенных с открытием американского посольства и финансовыми вопросами4 4

Лукашенко впервые призвал и Россию «пойти на компромисс»7 7

Лукашенко попросил прощения у Зеленского32 32

Перерывы «для гидратации» на чемпионате мира раздражают не только вас5 5

Есть ли среди силовиков в тюрьмах и колониях хорошие люди? Отвечает Лосик4 4

Почему минские автобусы желтые, а троллейбусы — салатовые? Оказалось, в этом есть логика6 6

В Беларуси запрещено работать еще одному известному тренеру, хотя он якобы и не в черных списках. В чем провинился?1 1

Mark Formelle продемонстрировал будущие коллекции и снова попал в скандал2 2

Белорусы в Threads помогали «Сергею» с переломом ноги. Но оказалось, что это мошенник2 2

Немецкий генерал рассказал, куда НАТО будет в первую очередь бить по России в случае конфликта10 10

В Бяла-Подляске среди бела дня убили российского карикатуриста. Он принимал участие в белорусских акциях34 34

На озере под Полоцком нашли тело известного уролога Геннадия Щетко1 1

Главного редактора «Еврорадио» внесли в базу украинского сайта «Миротворец»20 20

В Венгрии изменили Конституцию, чтобы не позволить Орбану снова стать премьер-министром4 4

Молодое поколение перестало этого стесняться: 22% американцев поколения Z считают себя ЛГБТК. Абсолютное большинство из них — это бисексуалы39 39

Вэнс призвал Иран вести себя как нормальная страна1 1

Убитый в Польше российский художник одну из картин продал за $20 тысяч и задонатил ВСУ. Вот что рассказал его знакомый белорус Бохан4 4

Одни ничьи. Результаты футбольной ночи на мундиале1 1

Как улучшить ночной сон младенца? Поможет папа3 3

Самец белорусской рыси очень удивил учёных2 2

Фотограф из Калинковичей засудил Московский зоопарк, который использовал без разрешения его фото норки2 2

«Это его подушка безопасности». На трассе под Минском заметили необычный способ перевозки шин2 2

В США разбился стратегический бомбардировщик5 5