Навука і тэхналогіі33

Як гэта працуе: машынны пераклад з розных моваў

7 студзеня 1954 года ў штаб-кватэры карпарацыі IBM у Нью-Ёрку адбыўся так званы «Джорджтаўнскі эксперымент», падчас якога быў паспяхова прадэманстраваны цалкам аўтаматычны пераклад некалькіх дзясяткаў розных сказаў з рускай мовы на ангельскую.

Той пераклад быў вельмі просты: у слоўніку было ўсяго 250 словаў і 6 правілаў, таму сістэма магла перакласці толькі некалькі самых прымітыўных фраз. Але мэтай было прыцягненне ўвагі да машыннага перакладу і дэманстрацыя яго перспектыўнасці.

Цяпер, дзякуючы інтэрнэту, кожнае незнаёмае слова ці сказ можна за некалькі секунд перакласці на родную мову, і гэты пераклад атрымаецца даволі дакладны. Што ж змянілася з тых часоў? Які цяпер прынцып працы аўтаматычных перакладчыкаў і якая будучыня ў жывых перакладчыкаў-прафесіяналаў?

Сучасныя анлайн-перакладчыкі (самы вядомы з якіх — Google Translate) выкарыстоўваюць статыстычны машынны пераклад, у працэсе якога камп’ютарная праграма аналізуе велізарны масіў тэкстаў, перакладзеных людзьмі, і перакладае слоўнік і граматыку адной мовы на іншую ў лічбавым фармаце. Гучыць складана? Давайце разбірацца.

Велізарны масіў тэкстаў складаецца з вялікай колькасці моўных пар — тэкстаў, якія маюць дзве дакладныя моўныя версіі (перакладзеныя чалавекам). У якасці такіх тэкстаў звычайна выкарыстоўваюцца афіцыйныя дакументы шматмоўных краін, дзе пераклад дакументацыі ёсць абавязковым на ўсе дзяржаўныя мовы. Такія пераклады заўсёды найбольш дасканалыя, бо дзяржаўныя дакументы вырашаюць лёс асобных людзей і краіны ў цэлым. Таксама вельмі карыснымі аказаліся шматмоўныя дакументы, якія выпускаюцца ААН. 

Аналізуючы пары розных тэкстаў, сістэма «вучыцца», засвойваючы з кожным разам усё больш новых правілаў. Такім чынам будуецца мадэль мовы.

Таксама кожная сістэма аўтаматычнага перакладу мае мадэль перакладу — «слоўнік», у якім для ўсіх словаў і фраз на адной мове пералічаныя магчымыя пераклады на іншую мову з указаннем верагоднасці гэтых перакладаў. Мадэлі перакладу для кожнай пары моваў утрымліваюць мільёны пар слоў і словазлучэнняў.

Калі вы перакладаеце з англійскай мовы на беларускую, задзейнічаюцца дзве моўныя пары: беларуская-руская і руская-англійская. То бок спачатку тэкст перакладаецца с англійскай на рускую, а потым — з рускай на беларускую.

Такі шлях найбольш рацыянальны, бо дакументаў, якія б мелі дасканалыя англійскую і беларускую версіі — няшмат, і просты пераклад з англійскай на беларускую атрымліваўся б вельмі няякасным праз недастатковую «навучанасць» сістэмы.

Непасрэдна перакладам займаецца дэкодар — алгарытм, які праводзіць аналіз тэксту і для кожнага слова падбірае ўсе варыянты перакладу, упарадкоўваючы іх па змяншэнні верагоднасці. Затым усе атрыманыя варыянты дэкодар ацэньвае з дапамогай мадэлі мовы на частату ўжывання і выбірае прапанову з найлепшым спалучэннем верагоднасці і частаты.

На жаль, цяпер няма сэрвісу аўтаматычнага перакладу, які б мог перакласці тэкст з такой жа дакладнасцю, як і чалавек-перакладчык. Але ўжо цяпер некаторыя кампаніі ўкараняюць у машынны пераклад нейронныя сеткі, якія значна паляпшаюць яго якасць.

Таму можна меркаваць, што з цягам часу спецыялісты-перакладчыкі будуць патрэбныя толькі для стварэння складаных мастацкіх перакладаў, што значна скароціць колькасць людзей, занятых у гэтай сферы. Але наўрад ці гэта вельмі блізкая перспектыва. А як лічыце вы?

Чытайце таксама: Наступная рэвалюцыя ў інфарматыцы — нейронныя сеткі (распавядаем пра нейронныя сеткі простымі словамі)

Каментары3

Жыхарцы Магілёва пагражаюць крыміналкай за тое, што зняла ранішнюю чаргу ў рэгістратуру3

Жыхарцы Магілёва пагражаюць крыміналкай за тое, што зняла ранішнюю чаргу ў рэгістратуру

Усе навіны →
Усе навіны

У Пінску закрылі буйны махлярскі кол-цэнтр. Пацярпелых — амаль 50 тысяч чалавек4

Перад прыездам Лукашэнкі ў Пакістан там забаранілі агульнанацыянальны марш апазіцыі. Тысячы затрыманых5

Пачынаецца суд над святаром Генрыхам Акалатовічам. Яму пагражае да 15 гадоў

Матацыкліст зачапіў тварам дрот, нацягнуты паміж дрэў у лесе пад Гродна6

Фізічныя практыкаванні дапамагаюць аднавіць нервовыя клеткі. Вось як гэта ўдалося даказаць1

У Вільні грузавы «Боінг» упаў на двухпавярховы жылы дом і загарэўся. Ёсць загінулыя3

8 нагод наведаць самы маленькі горад Беларусі5

У Турцыі пасля пасадкі загарэўся расійскі пасажырскі Sukhoi Superjet 100. Каторы раз такое з гэтым самалётам2

Качалоўская: На «Міс Сусвет» я зразумела, што такое жаночая жорсткасць. А ў прыбіральню нас вадзілі ахоўнікі10

больш чытаных навін
больш лайканых навін

Жыхарцы Магілёва пагражаюць крыміналкай за тое, што зняла ранішнюю чаргу ў рэгістратуру3

Жыхарцы Магілёва пагражаюць крыміналкай за тое, што зняла ранішнюю чаргу ў рэгістратуру

Галоўнае
Усе навіны →