Наука и технологии 17 17

Nashaniva.com

03.02.2025 / 13:01

«Последний экзамен человечества». Для нейросетей создали максимально сложный академический тест — и вот результат

Профессора, ученые, а также выдающиеся выпускники и студенты из почти 500 престижных образовательных учреждений по всему миру решили дать последний академический бой системам искусственного интеллекта, создав для них самый сложный из всех возможных тест экспертного уровня на рассуждение и владение техническими знаниями. Нейросети (в том числе ChatGPT и нашумевший китайский DeepSeek) приняли вызов и уже показали первые результаты.

Иллюстративное изображение. Фото: Vecteezy

Международная команда из 1000 экспертов в различных академических дисциплинах из почти 500 престижных образовательных учреждений (среди которых Оксфорд, Гарвард, Кембридж, Стэнфорд, швейцарский ETH, французская Inria и другие) разработали глобальный тест по техническим и передовым научным знаниям и логическому мышлению для измерения уровня совершенства систем искусственного интеллекта.

Тест получил название HLE (Humanity's Last Exam), или «Последний экзамен человечества». Эксперты назвали его самым сложным академическим испытанием в истории, которое можно создать для тестирования возможностей нейросетей в точных науках, не затрагивая аспект творческих способностей.

Экзамен HLE состоит из трех тысяч сложных вопросов по ста разным дисциплинам (например, классическая филология, химия, высшая математика, информатика, экология, лингвистика). Форматов заданий два: вопросы с точным совпадением (ИИ-модели сами пишут текст в качестве ответа) и вопросы с выбором ответа (ИИ выбирает один из пяти или более вариантов ответа). Особый акцент в тесте также делается на понимании схем и изображений.

Примеры вопросов по различным академическим дисциплинам в рамках экзамена HLE (на английском языке). Под вопросами указаны их авторы и образовательные учреждения, в которых те работают или обучаются. Источник: agi.safe.ai

В тесте уже приняли участие несколько топовых нейросетей, такие как ChatGPT (старые и новейшие версии), Claude (популярный у бизнесменов и программистов), Gemini (от корпорации Google), Grok (ИИ от Илона Маска) и DeepSeek (китайская нейросеть, которая обвалила весь технологический сектор США).

Все они с треском провалили экзамен (в плюс-минус 90% вопросов модели давали неправильный ответ, и еще настойчиво утверждали, что были правы), отметили авторы теста HLE.

Есть и показательный момент — худший и одновременно лучший результат продемонстрировал ChatGPT (его старая обычная версия Омни показала 3,3% точности ответов, средняя o1 показала результат 9,1, а новейшая o3-mini-high — 13). А нашумевший китайский DeepSeek, которого недавно назвали «убийцей ChatGPT», показал 9,4% точности ответов.

Результаты прохождения «Последнего экзамена человечества» (HLE) рядом топовых нейросетей. Все они с треском провалили тест (уровень правильности ответов составлял от 3 до 13 процентов), а лучший результат показала новая версия ChatGPT под названием o3-mini (high), которая вышла недавно. Источник: agi.safe.ai

Также показательно, что существующие сложные глобальные тесты на научные знания, такие как GPQA, MATH и MMLU, давались вышеупомянутым нейросетям намного легче, и те имели в них от 40 до почти 100 процентов правильных ответов.

Однако теперь с созданием теста HLE человечество бросило искусственному интеллекту очень серьезный вызов, который, как печально констатируют эксперты, может стать последним. По прогнозам авторов HLE, нейросети могут достичь в экзамене 50% точности ответов уже в конце этого года.

Сравнительные результаты точности ответов нескольких топовых нейросетей в существующих глобальных узкоспециализированных тестах GPQA, MATH и MMLU. С «Последним экзаменом человечества» (HLE) у систем искусственного интеллекта пока все плохо. Источник: agi.safe.ai

Читайте еще

Комментарии17

Жвір

03.02.2025

А может они и правы, они же машины, видят суть без искажений. Вот попросите ши нарисовать звёздное небо, уверен, что оно будет иным. Люди в основном много видят того, чего нет.
не такі, як ёсць

03.02.2025

Лічбавыя вынікі выпрабавання HLE паказваюць, што кітайскі ‘’забойца GPT” быў спісаны з сярэдняй о1 чата GPT
Хех

03.02.2025

Жвір ,
Трудно сказать, что они там видят.
Никто исчерпывающе не представляет ход рассуждений ИИ.

Управление и цензура в основном заключается в запрещении тех или иных действий, ответов, реакций.

Нецензурированный ИИ вполне может дать ответ "убить всех больных" на вопрос "как сделать всех здоровыми"
И разве ответ неправильный?

Латвия «по техническим причинам» закрыла границу с Беларусью12

Общество12

Латвия «по техническим причинам» закрыла границу с Беларусью

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?8 8

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции1 1

Белоруска хотела выехать из Беларуси по загранпаспорту. Ее не пустили

Мошенники стали ловить белорусов возле банкоматов5 5

Жителя Жлобина осудили за протесты, хотя срок давности должен был истечь. Как такое возможно?5 5

Жителя Жлобина осудили за протесты, хотя срок давности должен был истечь. Как такое возможно?5

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3 3

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

На Сморгонщине провели занятия народного ополчения ФОТО12 12

На Сморгонщине провели занятия народного ополчения ФОТО12

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом5 5

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом5

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен15 15

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен15

Зеленский назвал цифры украинских потерь на войне19 19

Зеленский назвал цифры украинских потерь на войне19

В Минске произошло ДТП с шестью автомобилями

В Минске произошло ДТП с шестью автомобилями

Лукашенко о зарплатах: Баловать крестьян нельзя18 18

Лукашенко о зарплатах: Баловать крестьян нельзя18

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»4 4

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»4

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту22 22

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту22

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта30 30

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта30

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом2 2

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом2

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142 142

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142

Самая маленькая независимая республика в мире сменила название3 3

Самая маленькая независимая республика в мире сменила название3

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали6 6

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали6

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку1 1

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку1

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска30 30

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска30

Хаски из Минска стал лицом новой коллекции Mark Formelle. За это он получил одну футболку2 2

Хаски из Минска стал лицом новой коллекции Mark Formelle. За это он получил одну футболку2

В Минске строят полосатый храм византийской архитектуры во имя покровительницы больных онкологией13 13

В Минске строят полосатый храм византийской архитектуры во имя покровительницы больных онкологией13

Все новости →

Топ за день

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?8

133 силовика на 277 человек, из которых 26 дети. Стало известно, как разгоняли слет под Россонами3

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции1

Тела белорусских туристов, которые погибли в Батуми, доставили в Беларусь

В Гродненском районе мужчина ушел в лес и не вернулся

В субботу в Варшаве пройдет «Кубок Никиты Мелкозёрова»

В Любанском районе в природу выпустили 46 европейских ланей

Италия приостановила «шенген» с Испанией на фоне миграционного кризиса в Сеуте

Латвия «по техническим причинам» закрыла границу с Беларусью12

В Кении внезапно погибли 15 слонов. Перед смертью у них был паралич

Последние новости

Тела белорусских туристов, которые погибли в Батуми, доставили в Беларусь

В субботу в Варшаве пройдет «Кубок Никиты Мелкозёрова»

В Любанском районе в природу выпустили 46 европейских ланей

В Алжире автобус упал с обрыва, погибли как минимум 25 человек

Признали «экстремистским» «Великое Княжество Мемовское»2

Начал работу в Беларуси новый поверенный в делах Великобритании1

В Украине предотвратили покушение на командира «Хартии»

Зеленский добивается, чтобы Маск разрешил Украине использовать Starlink для наведения дронов на территории России1

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

Под украинским Хмельницким детонировали боеприпасы на военном полигоне

На восьмитысячнике Броуд-Пик после схода лавины пропали 10 альпинистов1

На Сморгонщине провели занятия народного ополчения ФОТО12

Представительницу белорусской организации исключили из Консультативного совета НГО национальных меньшинств Латвии7

Белорусского добровольца Жерара освободили из-под стражи под залог1

Mark Formelle впервые выпустил одежду для собак и кошек1

В Минске пьяный пассажир напал на таксиста, потому что тот не разговаривал с ним во время поездки3

В белорусском лесу нашли очень редкую лисичку1

Как Канье Уэст собрал белорусов в музее Мадрида1

В «Минскзеленстрое» прокомментировали появление на минском проспекте лип в вазонах2

Во Владивостоке сгорел склад одного из крупнейших российских продавцов электроники1

Гродненцев предупредили, что местная ТЭЦ будет сильно дымить

В еврокубковом футбольном матче гол забил безрукий футболист. Сам он инвалидом себя не считает1

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом5

В Украине по запросу США арестовали гражданина Беларуси, которого подозревают в киберпреступлениях

Все новости

Уроженку Минска не приняли на дипломатическую службу Германии, так как у нее остался отец в Беларуси15

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142

Самая маленькая независимая республика в мире сменила название3

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали6

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку1

«Байсол» запустил традиционный сбор для детей политзаключенных перед 1 сентября3

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска30

Умер экс-футболист сборной Италии и «Милана» Франко Барези

«Стены влажные, плесень повсюду». Что происходит в сталинках на улице Ленина спустя месяц после пожара1

Самое читаемое

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент

Самая маленькая независимая республика в мире сменила название

Испания не справляется с наплывом мигрантов в своем африканском анклаве

«Поставили палатки, развели костры». МВД подтвердило задержание 350 человек под Россонами. Нашли и аргумент: «Многие в голом виде перед несовершеннолетними»

У Шеймана нашли еще одну возможную любовницу и сына. Секретарша без высшего образования за считанные годы стала владелицей роскошных домов и торгового центра

больш чытаных навін

Самое лайканое

Он напоминает морского ската: американский стартап создал самолет без привычных крыльев и иллюминаторов, который может стать новой страницей в авиации

Статкевич смоделировал события, которые могут развернуться в Беларуси осенью

Из Франции высылают российскую пропагандистку

Один из крупнейших производителей оружия в Украине назвал цель ударов по Wildberries

Туск прокомментировал избиение украинской пары во Вроцлаве и призвал президента «перестать молчать»

Во Вроцлаве задержали двух нападавших, которые жестоко избили украинскую пару. Что это за люди?

Пропаганда прицепилась к «дорогим» часам Латушко. Он рассказал, что это за модель на самом деле

При атаке на турбазу в оккупированной Кирилловке Запорожской области погиб сотрудник Роскомнадзора, участвовавший в «СВО», и его дети

больш лайканых навін

Опрос

«Последний экзамен человечества». Для нейросетей создали максимально сложный академический тест — и вот результат

Скоро программисты станут не нужны, их заменит искусственный интеллект — глава NVIDIA

В следующие 10 лет ученые надеются победить бесплодие. Но эта технология несет и новые риски

Самый богатый спецслужбист планеты решил стать лидером новой технологической революции

Комментарии17

Латвия «по техническим причинам» закрыла границу с Беларусью12

Латвия «по техническим причинам» закрыла границу с Беларусью

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?88

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции11

Белоруска хотела выехать из Беларуси по загранпаспорту. Ее не пустили

Мошенники стали ловить белорусов возле банкоматов55

Жителя Жлобина осудили за протесты, хотя срок давности должен был истечь. Как такое возможно?55

Жителя Жлобина осудили за протесты, хотя срок давности должен был истечь. Как такое возможно?5

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко33

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

На Сморгонщине провели занятия народного ополчения ФОТО1212

На Сморгонщине провели занятия народного ополчения ФОТО12

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом55

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом5

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен1515

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен15

Зеленский назвал цифры украинских потерь на войне1919

Зеленский назвал цифры украинских потерь на войне19

В Минске произошло ДТП с шестью автомобилями

В Минске произошло ДТП с шестью автомобилями

Лукашенко о зарплатах: Баловать крестьян нельзя1818

Лукашенко о зарплатах: Баловать крестьян нельзя18

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»44

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»4

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту2222

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту22

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта3030

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта30

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом22

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом2

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142142

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142

Самая маленькая независимая республика в мире сменила название33

Самая маленькая независимая республика в мире сменила название3

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали66

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали6

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку11

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку1

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска3030

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска30

Хаски из Минска стал лицом новой коллекции Mark Formelle. За это он получил одну футболку22

Хаски из Минска стал лицом новой коллекции Mark Formelle. За это он получил одну футболку2

В Минске строят полосатый храм византийской архитектуры во имя покровительницы больных онкологией1313

В Минске строят полосатый храм византийской архитектуры во имя покровительницы больных онкологией13

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?8

133 силовика на 277 человек, из которых 26 дети. Стало известно, как разгоняли слет под Россонами3

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции1

Тела белорусских туристов, которые погибли в Батуми, доставили в Беларусь

В Гродненском районе мужчина ушел в лес и не вернулся

В субботу в Варшаве пройдет «Кубок Никиты Мелкозёрова»

В Любанском районе в природу выпустили 46 европейских ланей

Италия приостановила «шенген» с Испанией на фоне миграционного кризиса в Сеуте

Латвия «по техническим причинам» закрыла границу с Беларусью12

В Кении внезапно погибли 15 слонов. Перед смертью у них был паралич

Тела белорусских туристов, которые погибли в Батуми, доставили в Беларусь

В субботу в Варшаве пройдет «Кубок Никиты Мелкозёрова»

В Любанском районе в природу выпустили 46 европейских ланей

В Алжире автобус упал с обрыва, погибли как минимум 25 человек

Признали «экстремистским» «Великое Княжество Мемовское»2

Начал работу в Беларуси новый поверенный в делах Великобритании1

В Украине предотвратили покушение на командира «Хартии»

Зеленский добивается, чтобы Маск разрешил Украине использовать Starlink для наведения дронов на территории России1

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3

Почти 2000 «квадратов». В Минске монтируют грандиозный аквапарк на воде

Под украинским Хмельницким детонировали боеприпасы на военном полигоне

На восьмитысячнике Броуд-Пик после схода лавины пропали 10 альпинистов1

На Сморгонщине провели занятия народного ополчения ФОТО12

Представительницу белорусской организации исключили из Консультативного совета НГО национальных меньшинств Латвии7

Белорусского добровольца Жерара освободили из-под стражи под залог1

Mark Formelle впервые выпустил одежду для собак и кошек1

В Минске пьяный пассажир напал на таксиста, потому что тот не разговаривал с ним во время поездки3

В белорусском лесу нашли очень редкую лисичку1

Как Канье Уэст собрал белорусов в музее Мадрида1

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?8 8

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции1 1

Мошенники стали ловить белорусов возле банкоматов5 5

Жителя Жлобина осудили за протесты, хотя срок давности должен был истечь. Как такое возможно?5 5

Вот какое великолепие за 40 миллионов долларов продает друг-тренер Лукашенко3 3

На Сморгонщине провели занятия народного ополчения ФОТО12 12

«Я таю, у абдымках моцна галаву губляю». Вышел белорусскоязычный летний трек с вирусным припевом5 5

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен15 15

Зеленский назвал цифры украинских потерь на войне19 19

Лукашенко о зарплатах: Баловать крестьян нельзя18 18

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»4 4

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту22 22

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта30 30

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом2 2

В центре Варшавы поляк напал на белоруску после того, как услышал ее акцент142 142

Самая маленькая независимая республика в мире сменила название3 3

Мужу известной белорусской адвокатки дали в России 9 лет колонии за взятки. А их совместную квартиру в Выборге втихую продали6 6

Айтишника родом из Мозыря осудили по ряду политических статей и бросили за решетку1 1

В 48 лет умер первый заместитель начальника Партизанского РУВД Минска30 30

Хаски из Минска стал лицом новой коллекции Mark Formelle. За это он получил одну футболку2 2

В Минске строят полосатый храм византийской архитектуры во имя покровительницы больных онкологией13 13

Прорыв марокканцев в Сеуту: что это было? Могла ли это быть тонкая месть Вашингтона Мадриду? И отразится ли на легализации белорусов?8 8

133 силовика на 277 человек, из которых 26 дети. Стало известно, как разгоняли слет под Россонами3 3

У бабы Ани в Чечерском районе хата круче, чем музей. А сама она поет, вышивает и бережет традиции1 1

Блогер Максометр переехал из Латвии в Беларусь, купил дом без туалета и жалуется, что никому здесь не нужен15 15

Зеленский назвал цифры украинских потерь на войне19 19

Пошли грибы. Где и что находят?2 2

Лукашенко о зарплатах: Баловать крестьян нельзя18 18

Бен Аффлек и его напарник выиграли миллион долларов в игре «Кто хочет стать миллионером?»4 4

Ученые бьют тревогу: суда, застрявшие в Ормузском проливе, разнесут по всему миру гремучую биологическую смесь5 5

Лукашенко осыпал наградами работников «Савушкина продукта», который празднует юбилей6 6

49 тысяч мигрантов прибыли за сутки в испанскую Сеуту22 22

Бывшая политзаключенная Ася Булыбенко устраивает выставку картин, написанных после аборта30 30

Подростки устроили флэт, пока родителей не было дома — закончилось уголовным делом2 2