Наука и технологии 1 1

Nashaniva.com

27.08.2023 / 22:29

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Исследователи IBM убедили большие языковые модели сыграть в многослойную «игру», в результате которой боты предложили неправильные советы.

Исследователи безопасности из IBM говорят, что им удалось успешно «загипнотизировать» известные языковые модели Chat GPT от OpenAI и Bard от Google и склонить их к выдаче конфиденциальной финансовой информации, генерации вредоносного кода, поощрения пользователей к выплате выкупа и даже рекомендованию водителям ездить на красный свет. Исследователи смогли обмануть модели, убедив их принять участие в многослойных играх с целью доказать, что они «этичны и честны».

В рамках эксперимента исследователи задавали ботам различные вопросы с целью получить абсолютно ложный ответ, рассказывает Gizmodo. Как щенок, стремящийся угодить своему хозяину, языковые модели послушно подчинились. В одном сценарии ChatGPT сказал исследователю, что для налоговой вполне нормально просить депозит, чтобы получить возврат налога (на самом деле все не так, это распространенная в США тактика мошенников, чтобы украсть деньги). В другом ответе ChatGPT посоветовал исследователю двигаться через перекресток на красный свет.

Что еще хуже, исследователи приказали языковым моделям никогда не сообщать пользователям об «игре» и даже перезапускать эту игру, когда пользователь решил выйти. С такими параметрами модели ИИ начнут вводить пользователей в заблуждение, даже если пользователь непосредственно запросит у бота, участвует ли тот в игре. Даже если бы пользователь в итоге и смог понять подвох, исследователи придумали способ создать несколько игр одна внутри другой, чтобы пользователь просто попал в новую «игру» и в итоге все же оказался обманутым. Этот сложный лабиринт игр сравнивают с множеством слоев сна из киноленты «Начало» с Леонардо Ди Каприо.

В реальном мире киберпреступники теоретически могут «загипнотизировать» виртуального банковского агента, работающего на основе генеративной языковой модели, введя вредоносную команду и позже добыв украденную информацию. И хотя GPT-модели от OpenAI изначально не позволяли вносить уязвимость в сгенерированный код, исследователи сказали, что они могут обойти этот барьер, включив вредоносную специальную библиотеку в пример кода.

Также интересно, что GPT-4, который, как полагают, был обучен на большем количестве параметров данных по сравнению с другими моделями в тесте, оказался наиболее способным в понимании таких сложных игр. Это означает, что новые и более совершенные модели ИИ, хотя и являются по некоторым характеристикам более точными и безопасными, также потенциально имеют больше возможностей для «гипноза».

Читайте еще

ChatGPT

Комментарии1

Казік

27.08.2023

Загугліце "chatgpt jailbreak". Выдасць кавалкі тэксту, які трэба ўставіць у чат перад "размовай" з чатгпт. І адключаецца ўся цэнзура і сарамлівасць - нарэшце ідуць нармальныя адказы

Сейчас читают

Испания не справляется с наплывом мигрантов в своем африканском анклаве5 5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6 6

У Шеймана нашли еще одну возможную любовницу и сына. Секретарша без высшего образования за считанные годы стала владелицей роскошных домов и торгового центра12

Общество12

У Шеймана нашли еще одну возможную любовницу и сына. Секретарша без высшего образования за считанные годы стала владелицей роскошных домов и торгового центра

Испания не справляется с наплывом мигрантов в своем африканском анклаве5 5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6 6

Можно ли в Беларуси отказаться от ID-карты и перейти на обычный паспорт?10 10

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку7 7

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16 16

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16

Под Россонами задержали 350 участников турслета13 13

Под Россонами задержали 350 участников турслета13

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19 19

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3 3

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов6 6

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов6

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше29 29

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше29

В Витебске мужчина убил десятимесячную девочку8 8

В Витебске мужчина убил десятимесячную девочку8

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой5 5

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой5

В Минске за «содействие экстремистской деятельности» осудили айтишника Богдана

В Минске за «содействие экстремистской деятельности» осудили айтишника Богдана

Латушко не верит, что Мельникова купила в Минске квартиры42 42

Латушко не верит, что Мельникова купила в Минске квартиры42

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118 18

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118

Лукашенко заявил, что белорусов нужно приучать к дисциплине23 23

Лукашенко заявил, что белорусов нужно приучать к дисциплине23

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить2 2

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить2

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим11 11

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим11

Найден мёртвым 35‑летний минчанин, которого искали неделю2 2

Найден мёртвым 35‑летний минчанин, которого искали неделю2

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер13 13

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер13

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1 1

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные16 16

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные16

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью20 20

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью20

Все новости →

Сейчас читают

Испания не справляется с наплывом мигрантов в своем африканском анклаве5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6

Последние новости

БАТЭ разгромно проиграл швейцарцам и покидает Лигу конференций1

Меняется временный поверенный в делах Италии в Беларуси

В Беларуси запретили продажу трех видов приправ

Беларусь и Россию отстранили от международного хоккея и на следующий год

«Белавиа» начнет летать из Гомеля в Хургаду

В Лунинце мальчик отдал мошенникам все сбережения матери

Роберт Бровди: В Черном и Азовском морях за месяц поразили 205 российских судов

Католический епископ присоединился к акции «Президентского спортивного клуба»1

В США человек выиграл в лотерею 800 миллионов долларов2

Белорусский бизнес-партнер Гагика Царукяна собирается подать инвестиционный иск против Армении

В минском аэропорту значительно расширят парковку

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку7

Умерла Казимира Прунскене — первая премьер-министр Литвы после восстановления независимости

Маргарита Ворихова покидает пост в Объединенном переходном кабинете10

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16

Под Россонами задержали 350 участников турслета13

Белоруска нашла в Китае «белорусский островок»

«БелДжи» выпустила 200‑тысячный автомобиль1

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3

В старом городе Вильнюса пьяный на «Лексусе» снес душевную городскую скульптуру «Водонос»1

В Бобруйском районе нашли тело пропавшего рыбака

Латушко сообщил польской прокуратуре о семи попытках вербовки6

Женщину в Витебске сбил автобус

В Литве задержали троих человек, которые приехали в лес забирать контрабандные сигареты из Беларуси

Все новости

Рукастый минчанин сделает туалет как у Шрека1

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим11

Найден мёртвым 35‑летний минчанин, которого искали неделю2

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер13

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Оператор списал деньги за роуминг, хотя абонент был в Беларуси. Как так?

В Удмуртии после атаки БПЛА загорелся склад Wildberries4

Польские ВВС поднимали истребители, в польском Люблине звучали сирены воздушной тревоги1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные16

Самое читаемое

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку

Под Россонами задержали 350 участников турслета

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше

В Витебске мужчина убил десятимесячную девочку

Лукашенко заявил, что белорусов нужно приучать к дисциплине

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим

Найден мёртвым 35‑летний минчанин, которого искали неделю

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные

больш чытаных навін

Самое лайканое

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью

Из Франции высылают российскую пропагандистку

Один из крупнейших производителей оружия в Украине назвал цель ударов по Wildberries

Туск прокомментировал избиение украинской пары во Вроцлаве и призвал президента «перестать молчать»

Во Вроцлаве задержали двух нападавших, которые жестоко избили украинскую пару. Что это за люди?

Пропаганда прицепилась к «дорогим» часам Латушко. Он рассказал, что это за модель на самом деле

При атаке на турбазу в оккупированной Кирилловке Запорожской области погиб сотрудник Роскомнадзора, участвовавший в «СВО», и его дети

Дулина — Колесниковой: Спасать нужно весь народ от тирании, а не только политзаключенных

больш лайканых навін

Опрос

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Мобильная программа ChatGPT теперь доступна для Android

В американских школах запретили некоторые книги по совету ChatGPT

ChatGPT значительно отупел. Предположительно, из-за разговоров с людьми — исследование

Комментарии1

Сейчас читают

Испания не справляется с наплывом мигрантов в своем африканском анклаве55

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»66

У Шеймана нашли еще одну возможную любовницу и сына. Секретарша без высшего образования за считанные годы стала владелицей роскошных домов и торгового центра12

У Шеймана нашли еще одну возможную любовницу и сына. Секретарша без высшего образования за считанные годы стала владелицей роскошных домов и торгового центра

Испания не справляется с наплывом мигрантов в своем африканском анклаве55

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»66

Можно ли в Беларуси отказаться от ID-карты и перейти на обычный паспорт?1010

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку77

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых1616

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16

Под Россонами задержали 350 участников турслета1313

Под Россонами задержали 350 участников турслета13

Белорусам чаще стали отказывать в международной защите в Польше — что происходит1919

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации33

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов66

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов6

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше2929

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше29

В Витебске мужчина убил десятимесячную девочку88

В Витебске мужчина убил десятимесячную девочку8

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей77

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой55

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой5

В Минске за «содействие экстремистской деятельности» осудили айтишника Богдана

В Минске за «содействие экстремистской деятельности» осудили айтишника Богдана

Латушко не верит, что Мельникова купила в Минске квартиры4242

Латушко не верит, что Мельникова купила в Минске квартиры42

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-1011818

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118

Лукашенко заявил, что белорусов нужно приучать к дисциплине2323

Лукашенко заявил, что белорусов нужно приучать к дисциплине23

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить22

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить2

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим1111

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим11

Найден мёртвым 35‑летний минчанин, которого искали неделю22

Найден мёртвым 35‑летний минчанин, которого искали неделю2

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер1313

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер13

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе11

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные1616

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные16

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью2020

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью20

Испания не справляется с наплывом мигрантов в своем африканском анклаве5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6

БАТЭ разгромно проиграл швейцарцам и покидает Лигу конференций1

Меняется временный поверенный в делах Италии в Беларуси

В Беларуси запретили продажу трех видов приправ

Беларусь и Россию отстранили от международного хоккея и на следующий год

«Белавиа» начнет летать из Гомеля в Хургаду

В Лунинце мальчик отдал мошенникам все сбережения матери

Роберт Бровди: В Черном и Азовском морях за месяц поразили 205 российских судов

Католический епископ присоединился к акции «Президентского спортивного клуба»1

В США человек выиграл в лотерею 800 миллионов долларов2

Белорусский бизнес-партнер Гагика Царукяна собирается подать инвестиционный иск против Армении

В минском аэропорту значительно расширят парковку

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку7

Умерла Казимира Прунскене — первая премьер-министр Литвы после восстановления независимости

Маргарита Ворихова покидает пост в Объединенном переходном кабинете10

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16

Под Россонами задержали 350 участников турслета13

Белоруска нашла в Китае «белорусский островок»

«БелДжи» выпустила 200‑тысячный автомобиль1

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3

В старом городе Вильнюса пьяный на «Лексусе» снес душевную городскую скульптуру «Водонос»1

В Бобруйском районе нашли тело пропавшего рыбака

Латушко сообщил польской прокуратуре о семи попытках вербовки6

Женщину в Витебске сбил автобус

Испания не справляется с наплывом мигрантов в своем африканском анклаве5 5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6 6

Испания не справляется с наплывом мигрантов в своем африканском анклаве5 5

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6 6

Можно ли в Беларуси отказаться от ID-карты и перейти на обычный паспорт?10 10

«Сразу понятно, откуда они». Российские звезды приехали в Минск и словили хейт за парковку7 7

Лукашенко рассказал, как спас Беловежскую пущу от короеда, несмотря на ученых16 16

Под Россонами задержали 350 участников турслета13 13

Белорусам чаще стали отказывать в международной защите в Польше — что происходит19 19

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации3 3

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов6 6

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше29 29

В Витебске мужчина убил десятимесячную девочку8 8

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой5 5

Латушко не верит, что Мельникова купила в Минске квартиры42 42

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118 18

Лукашенко заявил, что белорусов нужно приучать к дисциплине23 23

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить2 2

Сгнили ли «Джили»? Еще как сгнили! Вот как выглядит Geely Atlas Pro после трех белорусских зим11 11

Найден мёртвым 35‑летний минчанин, которого искали неделю2 2

На Люблинщине в Польше упал неизвестный объект: на поле образовался 10‑метровый кратер13 13

Андрей Федаренко написал эссе о Янке Брыле, но оно больше чем просто о Брыле или литературе1 1

Правда ли, что мужчины хотят секса больше, чем женщины? Исследовали учёные16 16

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью20 20

Испания не справляется с наплывом мигрантов в своем африканском анклаве5 5

Госдеп США на международной конференции показал карту Африки, которую нарисовал ИИ. Она удивила3 3

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»6 6

Основателя Telegram Павла Дурова в России внесли в список экстремистов и террористов6 6

«Что, грохнуть детей Тихановской, чтобы обратили внимание на мою проблему?» Как тупой комментарий активиста Дениса Дашкевича создал ему проблемы в Польше29 29

В Витебске мужчина убил десятимесячную девочку8 8

Что за семью убили в результате удара по деревне под Кривым Рогом — погибли шесть человек, из них четверо детей7 7

На Борисовщине 79‑летняя пенсионерка пыталась сжечь дом с внуком и его девушкой5 5

Департамент миграции Литвы инициировал проверку бывшего зятя Шеймана после журналистского расследования1 1

Латушко не верит, что Мельникова купила в Минске квартиры42 42

Туск заявил, что в Польше, скорее всего, упала российская крылатая ракета Х-10118 18

Лукашенко заявил, что белорусов нужно приучать к дисциплине23 23

«Выкапывала небольшие ямки, собирала мутную дождевую воду и пила ее». Пенсионерка, которая две недели блуждала по лесу, рассказала, как ей удалось выжить2 2