Наука и технологии 1 1

Nashaniva.com

27.08.2023 / 22:29

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Исследователи IBM убедили большие языковые модели сыграть в многослойную «игру», в результате которой боты предложили неправильные советы.

Исследователи безопасности из IBM говорят, что им удалось успешно «загипнотизировать» известные языковые модели Chat GPT от OpenAI и Bard от Google и склонить их к выдаче конфиденциальной финансовой информации, генерации вредоносного кода, поощрения пользователей к выплате выкупа и даже рекомендованию водителям ездить на красный свет. Исследователи смогли обмануть модели, убедив их принять участие в многослойных играх с целью доказать, что они «этичны и честны».

В рамках эксперимента исследователи задавали ботам различные вопросы с целью получить абсолютно ложный ответ, рассказывает Gizmodo. Как щенок, стремящийся угодить своему хозяину, языковые модели послушно подчинились. В одном сценарии ChatGPT сказал исследователю, что для налоговой вполне нормально просить депозит, чтобы получить возврат налога (на самом деле все не так, это распространенная в США тактика мошенников, чтобы украсть деньги). В другом ответе ChatGPT посоветовал исследователю двигаться через перекресток на красный свет.

Что еще хуже, исследователи приказали языковым моделям никогда не сообщать пользователям об «игре» и даже перезапускать эту игру, когда пользователь решил выйти. С такими параметрами модели ИИ начнут вводить пользователей в заблуждение, даже если пользователь непосредственно запросит у бота, участвует ли тот в игре. Даже если бы пользователь в итоге и смог понять подвох, исследователи придумали способ создать несколько игр одна внутри другой, чтобы пользователь просто попал в новую «игру» и в итоге все же оказался обманутым. Этот сложный лабиринт игр сравнивают с множеством слоев сна из киноленты «Начало» с Леонардо Ди Каприо.

В реальном мире киберпреступники теоретически могут «загипнотизировать» виртуального банковского агента, работающего на основе генеративной языковой модели, введя вредоносную команду и позже добыв украденную информацию. И хотя GPT-модели от OpenAI изначально не позволяли вносить уязвимость в сгенерированный код, исследователи сказали, что они могут обойти этот барьер, включив вредоносную специальную библиотеку в пример кода.

Также интересно, что GPT-4, который, как полагают, был обучен на большем количестве параметров данных по сравнению с другими моделями в тесте, оказался наиболее способным в понимании таких сложных игр. Это означает, что новые и более совершенные модели ИИ, хотя и являются по некоторым характеристикам более точными и безопасными, также потенциально имеют больше возможностей для «гипноза».

Читайте еще

ChatGPT

Комментарии1

Казік

27.08.2023

Загугліце "chatgpt jailbreak". Выдасць кавалкі тэксту, які трэба ўставіць у чат перад "размовай" з чатгпт. І адключаецца ўся цэнзура і сарамлівасць - нарэшце ідуць нармальныя адказы

Нажатие кнопки «Добавить комментарий» означает согласие с рекомендациями по обсуждению.

Сейчас читают

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице1 1

Белорусы все чаще пропадают, отправляясь на работу в Россию2 2

Трамп призвал Путина остановиться11 11

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21 21

33-летний Даниил Гаркавый, который неожиданно покинул Офис Тихановской, рассказал о своей онкологии и семи операциях4

Общество4

33-летний Даниил Гаркавый, который неожиданно покинул Офис Тихановской, рассказал о своей онкологии и семи операциях

«Получаем обрывки информации, у нас нет связи». Сестра Марии Колесниковой рассказала последние новости о ней2 2

Витольд Юраш: Польша предала белорусскую оппозицию14 14

Индия обвиняет Пакистан в гибели туристов и угрожает оставить его без воды. Страны на грани войны1 1

Ватикан пригласил Светлану Тихановскую на похороны Папы Франциска1 1

Может ли Игорь Сергеенко, который находится в санкционном списке Евросоюза, попасть в Ватикан? Оказывается, легко!1 1

Может ли Игорь Сергеенко, который находится в санкционном списке Евросоюза, попасть в Ватикан? Оказывается, легко!1

Китаянка сделала более 100 пластических операций и теперь выглядит так6 6

Китаянка сделала более 100 пластических операций и теперь выглядит так6

Трамп призвал Путина остановиться11 11

Трамп призвал Путина остановиться11

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5 5

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5 5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5

Евросоюз предупредил США, что не признает Крым российским4 4

Евросоюз предупредил США, что не признает Крым российским4

Айтишники больше не лидируют по средней зарплате в Беларуси

Айтишники больше не лидируют по средней зарплате в Беларуси

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7 7

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку8 8

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку8

Позняк поименно перечислил агентуру120 120

Позняк поименно перечислил агентуру120

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21 21

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались6 6

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались6

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж18 18

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж18

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых2 2

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых2

«Минимальная зарплата врача в Польше больше, чем я имела в белорусском частном центре». Доктор Маркелова — о работе в польской больнице и производстве натуральной косметики13 13

«Минимальная зарплата врача в Польше больше, чем я имела в белорусском частном центре». Доктор Маркелова — о работе в польской больнице и производстве натуральной косметики13

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов13 13

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов13

«Не кажы ты мне слоў, што не грэюць цяплом», Александр Чернухо4 4

«Не кажы ты мне слоў, што не грэюць цяплом», Александр Чернухо4

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским23 23

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским23

Польская прокуратура не дает согласия на разглашение информации по делу Мельниковой

Польская прокуратура не дает согласия на разглашение информации по делу Мельниковой

Борисовская вокалистка считает, что 1000 рублей — хорошая зарплата для молодого специалиста. С ней многие не согласились6 6

Борисовская вокалистка считает, что 1000 рублей — хорошая зарплата для молодого специалиста. С ней многие не согласились6

Все новости →

Сейчас читают

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице1

Белорусы все чаще пропадают, отправляясь на работу в Россию2

Трамп призвал Путина остановиться11

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21

Последние новости

Албания приостановила безвизовый режим с Беларусью

Издательство «Янушкевич» приобрело права на издание двух важных произведений

Определили ставки для охоты на белорусских медведей и рысей

Гродненского студента будут судить за сообщения в «Беларускі Гаюн»

С 1 мая подорожают некоторые сигареты

Российская разведка обвинила оппозиционеров в подрыве миротворческих усилий Трампа2

Белорусы собрали почти 2 миллиона долларов на лекарства для барановичского мальчика с СМА

Вынесли крупные заочные приговоры группе бойцов-калиновцев — вплоть до 20 лет6

От Беларуси на похороны Папы Римского поедет Игорь Сергеенко2

Трамп призвал Путина остановиться11

«Норм или стрем работать в колхозе?» Белорусские аграрии ответили на непростые вопросы о своей жизни

Зеленский: Украина готова к переговорам с террористами после полного прекращения огня. Это большой компромисс4

В Беларуси новое «экстремистское формирование»

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5

Евросоюз предупредил США, что не признает Крым российским4

Песков: Слова Трампа про Крым соответствуют позиции России4

Айтишники больше не лидируют по средней зарплате в Беларуси

В Молодечно девушка принимала солнечные ванны на самом краю крыши. Пошли будить спасатели5

Власти Латвии обяжут белорусов сообщать о въезде в страну с территории Шенгенской зоны1

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7

Двое суток на авто, 7—12 часов на автобусе. Что происходит с выездом из Беларуси в Польшу?3

Минчанка продала четырехкомнатную квартиру и сама отвезла деньги в Москву мошенникам2

Гендиректор хоккейного «Динамо» испытал беспрецедентный экстаз от приезда на тренировку Лукашенко7

Все новости

В Киеве из-под руин дома все еще слышны звонки телефонов3

Священник Сергей Трыстень находится дома

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж18

Трамп: У нас есть договор с Россией, теперь необходимо согласие Зеленского9

Умер военный корреспондент российского телеканала «Звезда»1

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых2

«Минимальная зарплата врача в Польше больше, чем я имела в белорусском частном центре». Доктор Маркелова — о работе в польской больнице и производстве натуральной косметики13

Белый дом про последнее заявление Трампа: у президента «заканчивается терпение»13

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов13

Самое читаемое

Позняк поименно перечислил агентуру

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж

«Жестокость под видом благотворительности». В Австралии из вертолета расстреляли до 700 коал

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским

МВД показало видео с задержанными за комментарии в адрес «жителей чудесной страны Пакистана». Грозит уголовками

В 44 года умер политзаключенный из Быхова

«Дети сходили в садик два дня. И я уже хочу забрать документы»: россиянка из Крыма в бешенстве от белорусского сада

Почему белорусов не избирают кардиналами?

больш чытаных навін

Самое лайканое

Витольд Юраш: Польша предала белорусскую оппозицию

Ватикан пригласил Светлану Тихановскую на похороны Папы Франциска

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку

Позняк поименно перечислил агентуру

«Минимальная зарплата врача в Польше больше, чем я имела в белорусском частном центре». Доктор Маркелова — о работе в польской больнице и производстве натуральной косметики

Происходит детонация боеприпасов на складе российской армии во Владимирской области

Степан Путило: Кажется, Протасевич делает даже чуть больше, чем от него требовалось

Звезда фильма «Сумерки» заключила брак со своей избранницей

больш лайканых навін

Опрос

«Загипнотизированные» ChatGPT и Bard могут убеждать пользователей платить мошенникам и проезжать на красный свет

Мобильная программа ChatGPT теперь доступна для Android

В американских школах запретили некоторые книги по совету ChatGPT

ChatGPT значительно отупел. Предположительно, из-за разговоров с людьми — исследование

Комментарии1

Сейчас читают

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице11

Белорусы все чаще пропадают, отправляясь на работу в Россию22

Трамп призвал Путина остановиться1111

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши2121

33-летний Даниил Гаркавый, который неожиданно покинул Офис Тихановской, рассказал о своей онкологии и семи операциях4

33-летний Даниил Гаркавый, который неожиданно покинул Офис Тихановской, рассказал о своей онкологии и семи операциях

«Получаем обрывки информации, у нас нет связи». Сестра Марии Колесниковой рассказала последние новости о ней22

Витольд Юраш: Польша предала белорусскую оппозицию1414

Индия обвиняет Пакистан в гибели туристов и угрожает оставить его без воды. Страны на грани войны11

Ватикан пригласил Светлану Тихановскую на похороны Папы Франциска11

Может ли Игорь Сергеенко, который находится в санкционном списке Евросоюза, попасть в Ватикан? Оказывается, легко!11

Может ли Игорь Сергеенко, который находится в санкционном списке Евросоюза, попасть в Ватикан? Оказывается, легко!1

Китаянка сделала более 100 пластических операций и теперь выглядит так66

Китаянка сделала более 100 пластических операций и теперь выглядит так6

Трамп призвал Путина остановиться1111

Трамп призвал Путина остановиться11

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?55

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал55

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5

Евросоюз предупредил США, что не признает Крым российским44

Евросоюз предупредил США, что не признает Крым российским4

Айтишники больше не лидируют по средней зарплате в Беларуси

Айтишники больше не лидируют по средней зарплате в Беларуси

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики77

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку88

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку8

Позняк поименно перечислил агентуру120120

Позняк поименно перечислил агентуру120

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши2121

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались66

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались6

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж1818

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж18

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых22

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых2

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов1313

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов13

«Не кажы ты мне слоў, што не грэюць цяплом», Александр Чернухо44

«Не кажы ты мне слоў, што не грэюць цяплом», Александр Чернухо4

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским2323

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским23

Польская прокуратура не дает согласия на разглашение информации по делу Мельниковой

Польская прокуратура не дает согласия на разглашение информации по делу Мельниковой

Борисовская вокалистка считает, что 1000 рублей — хорошая зарплата для молодого специалиста. С ней многие не согласились66

Борисовская вокалистка считает, что 1000 рублей — хорошая зарплата для молодого специалиста. С ней многие не согласились6

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице1

Белорусы все чаще пропадают, отправляясь на работу в Россию2

Трамп призвал Путина остановиться11

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21

Албания приостановила безвизовый режим с Беларусью

Издательство «Янушкевич» приобрело права на издание двух важных произведений

Определили ставки для охоты на белорусских медведей и рысей

Гродненского студента будут судить за сообщения в «Беларускі Гаюн»

С 1 мая подорожают некоторые сигареты

Российская разведка обвинила оппозиционеров в подрыве миротворческих усилий Трампа2

Белорусы собрали почти 2 миллиона долларов на лекарства для барановичского мальчика с СМА

Вынесли крупные заочные приговоры группе бойцов-калиновцев — вплоть до 20 лет6

От Беларуси на похороны Папы Римского поедет Игорь Сергеенко2

Трамп призвал Путина остановиться11

«Норм или стрем работать в колхозе?» Белорусские аграрии ответили на непростые вопросы о своей жизни

Зеленский: Украина готова к переговорам с террористами после полного прекращения огня. Это большой компромисс4

В Беларуси новое «экстремистское формирование»

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5

Евросоюз предупредил США, что не признает Крым российским4

Песков: Слова Трампа про Крым соответствуют позиции России4

Айтишники больше не лидируют по средней зарплате в Беларуси

В Молодечно девушка принимала солнечные ванны на самом краю крыши. Пошли будить спасатели5

Власти Латвии обяжут белорусов сообщать о въезде в страну с территории Шенгенской зоны1

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7

Двое суток на авто, 7—12 часов на автобусе. Что происходит с выездом из Беларуси в Польшу?3

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице1 1

Белорусы все чаще пропадают, отправляясь на работу в Россию2 2

Трамп призвал Путина остановиться11 11

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21 21

«Получаем обрывки информации, у нас нет связи». Сестра Марии Колесниковой рассказала последние новости о ней2 2

Витольд Юраш: Польша предала белорусскую оппозицию14 14

Индия обвиняет Пакистан в гибели туристов и угрожает оставить его без воды. Страны на грани войны1 1

Ватикан пригласил Светлану Тихановскую на похороны Папы Франциска1 1

Может ли Игорь Сергеенко, который находится в санкционном списке Евросоюза, попасть в Ватикан? Оказывается, легко!1 1

Китаянка сделала более 100 пластических операций и теперь выглядит так6 6

Трамп призвал Путина остановиться11 11

Беларусь заняла второе место по преступности среди европейских стран. Как же составляли такой рейтинг?5 5

Стукач из «Грамады», который в прошлом году пытался пролезть в Координационный совет, уехал в Польшу и пропал5 5

Евросоюз предупредил США, что не признает Крым российским4 4

Милиция предлагает, чтобы амнистия затронула почти всех осужденных за наркотики7 7

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку8 8

Позняк поименно перечислил агентуру120 120

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21 21

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались6 6

Актриса из Минска пырнула в Петербурге пьяного любовника. Он просит ее не наказывать, а из Беларуси на помощь едет муж18 18

Россия нанесла массированный удар по городам Украины, в Киеве — девять погибших, 63 раненых2 2

Шпаковский о совладельце «Варгейминга» Кацелапове: Профинансировал протесты на 296 тысяч долларов13 13

«Не кажы ты мне слоў, што не грэюць цяплом», Александр Чернухо4 4

Трамп раскритиковал Зеленского за заявление, что Украина никогда не признает Крым российским23 23

Борисовская вокалистка считает, что 1000 рублей — хорошая зарплата для молодого специалиста. С ней многие не согласились6 6

Великобритания может отказаться от отправки миротворцев в Украину из-за риска войны с Россией3 3

«Мягко говоря, меня трясло». Белоруска получила счета на 40 тысяч евро за четыре дня в швейцарской больнице1 1

«Получаем обрывки информации, у нас нет связи». Сестра Марии Колесниковой рассказала последние новости о ней2 2

Завербованный ГРУ аферист. Кто тот литовец, который рассылал в ЕС загоравшиеся посылки4 4

Магазин «Соседи» в Слуцке сегодня вовремя не открылся: работники устроили забастовку8 8

В Беларуси пройдет амнистия к 80-летию Победы3 3

«Турецкий актер» сильно влюбился в белоруску и послал ей подарок. Возбуждено уголовное дело3 3

Шойгу обвинил Европу в подготовке к войне с Россией до 2030 года8 8

Министр обороны США распорядился оборудовать в Пентагоне комнату для макияжа во время объявленного сокращения расходов2 2

Позняк поименно перечислил агентуру120 120

Растет ли преступность после приезда иммигрантов? Проверили на примере Польши21 21

Белорусский экс-сенатор оригинально снялся в рекламе отеля в Гродно1 1

Сотни тысяч белорусов следили за парнем, которому девушка помогала восстанавливаться после страшной аварии. Они расстались6 6