Навука і тэхналогіі22

Штучны інтэлект ужо праз два гады можа вычарпаць рэсурсы з адкрытых крыніц

Крыніцай для навучання новых мадэляў могуць стаць прыватныя даныя. Гэта дазволіць пратрымацца да канца дзесяцігоддзя.

Artificial intelligence Штучны інтэлект Искусственный интеллект
Выява: vecteezy.com

Вынікі новага даследавання паказваюць, што сістэмы штучнага інтэлекту (ШІ) могуць выкарыстаць усе якасныя агульнадаступныя даныя, якія размешчаны ў інтэрнеце, у перыяд паміж 2026 і 2032-м гадамі, што можа прывесці да адноснай стагнацыі ў гэтай вобласці.

У сваіх ацэнках даследчыкі выкарыстоўвалі вэб-індэкс Google. Па іх падліках, у цяперашні час існуе каля 250 мільярдаў вэб-старонак, якія змяшчаюць 7 Кб тэксту на старонку. Каб спрагназаваць рост даступнага запасу даных навукоўцы правялі аналіз трафіку інтэрнэт-пратакола (IP) — патоку дадзеных у сетцы – і актыўнасці карыстальнікаў у інтэрнэце.

Разлікі паказалі, што інфармацыя з надзейных крыніц скончыцца ў лепшым выпадку да 2032 года, у горшым — ужо праз два гады, у 2026-м.

Калі разглядаць даныя нізкай якасці, якія прыводзяць да выдачы парадаў кшталту дадавання клею ў піцу ці ўжывання ў ежу камення, як гэта было ў выпадку з штучным інтэлектам Gemini ад Google, які для адказаў выкарыстоўваў пасты на Reddit і артыкулы з сатырычнага сайта The Onion, то яны скончацца паміж 2030 і 2050-м гадамі.

Пытанне адносна здольнасці распрацоўшчыкаў ва ўмовах недахопу новых даных павысіць эфектыўнасць сваіх мадэлей застаецца адкрытым. Аўтары бачаць некалькі магчымых спосабаў яго вырашэння.

Першы — выкарыстанне прыватных даных. Па словах аднаго з аўтараў даследавання Пабла Вільялобаса (Pablo Villalobos) з цэнтра Epoch IA (ЗША), калі ў кампаній атрымаецца іх выкарыстаць, і пры гэтым каштоўнасць прыватных даных будзе супастаўная з каштоўнасцю агульнадаступных даных, то цалкам верагодна, што стваральнікі ШІ пратрымаюцца да канца дзесяцігоддзя.

Але выкарыстанне прыватных даных, якія абаронены аўтарскім правам ці правам на таямніцу асабістага жыцця, можа мець юрыдычныя праблемы. Вядомы выпадкі, калі стваральнікі кантэнту падавалі ў суд на такія кампаніі, як Microsoft, OpenAI і Stability AI, выказваючы пратэст несанкцыянаванаму выкарыстанню іх тэкстаў для навучання мадэляў ШІ. Рашэннем праблемы магла б стаць выплата распрацоўшчыкамі нейрасетак узнагароджання аўтарам кантэнту.

Іншым варыянтам можа быць выкарыстанне сінтэтычных даных — штучна згенераваных. Такія даныя паспяхова ўжываліся толькі ў сістэмах навучання гульням, праграмаванню і матэматыцы.

Даследчыкі адзначаюць, што недахоп даных — не адзіная праблема на шляху далейшага ўдасканалення ШІ. На ім ёсць і іншыя вузкія месцы — рост энергаспажывання, выдаткі на навучанне і даступнасць абсталявання. Так, па даных Міжнароднага энергетычнага агенцтва, пошук у Google з выкарыстаннем ChatGPT спажывае амаль у 10 разоў больш электрычнасці, чым традыцыйны.

Каментары2

  • глеба
    27.06.2024
    Пры гэтым няма чалавека, які б прачытаў прынамсі адну мільённую ад усіх гэтых тэкстаў. Нават няграматны чалавек можа быць кемлівым, вынаходлівым і мудрым. Відавочна, што падыход да стварэння штучнага розуму мусіць быць іншы, чым проста агромністая база ўсіх тэкстаў.
    • жэўжык
      27.06.2024
      глеба, няграматнага чалавека ўсё ж такі навучаюць у школе. Тлумачаць, як адрозніваць тое, што мае сэнс, ад лухты. Калі дзіцёнку замест школы даць проста неабмежаваны інтэрнэт, то будзе катастрафічны вынік.
 
Націсканне кнопкі «Дадаць каментар» азначае згоду з рэкамендацыямі па абмеркаванні.

Цяпер чытаюць

Мяркуючы па пасажырапатоку транспарту, насельніцтва Беларусі з 2019-га скарацілася, можа, нават на 1,2 мільёна чалавек15

Мяркуючы па пасажырапатоку транспарту, насельніцтва Беларусі з 2019-га скарацілася, можа, нават на 1,2 мільёна чалавек

Усе навіны →
Усе навіны

Журналісты высветлілі імя «Доктара Зло», што катаваў украінскіх палонных у расійскай калоніі6

Лукашэнка расказаў сваё ўяўленне пра ролю прафсаюзаў у краіне6

Польку затрымалі ў Гданьску за абразу беларускі4

Жыхары «Новай Баравой» выступілі супраць цырка-шапіто ў іх раёне. Чым скончылася?6

Прарасійская актывістка Мірсалімава патлумачыла, чаму нельга забараняць чытаць «экстрэмісцкія» выданні7

Злоўленая ў Сеніцы жывёліна аказалася шалёным ваўком. У міліцыі расказалі падрабязнасці6

Як упарадкавалі сквер Амара Хаяма ў Мінску

Жанчына займалася сэксам з будысцкімі манахамі, а пасля шантажавала іх13

Беларускі школьны настаўнік расказаў, колькі зарабляе на ферме ў Нідэрландах1

больш чытаных навін
больш лайканых навін

Мяркуючы па пасажырапатоку транспарту, насельніцтва Беларусі з 2019-га скарацілася, можа, нават на 1,2 мільёна чалавек15

Мяркуючы па пасажырапатоку транспарту, насельніцтва Беларусі з 2019-га скарацілася, можа, нават на 1,2 мільёна чалавек

Галоўнае
Усе навіны →

Заўвага:

 

 

 

 

Закрыць Паведаміць