Štučny intelekt dapamoh pračytać tablički z klinapisam, jakim piać tysiač hadoŭ
Madel, stvoranaja archieołahami i śpiecyjalistami pa mašynnym navučańni, maje šaniec zrabić revalucyju ŭ daśledavańniach najstaražytniejšaj piśmiennaści, stvoranaj čałaviectvam.
Da siońnia mnohija staražytnyja piśmovyja sistemy zastajucca nierasšyfravanymi. Siarod ich piśmo cyvilizacyi daliny Inda, liniejnaje piśmo A, jakim karystalisia staražytnyja žychary Kryta, a taksama piśmo, jakoje naniesiena na Fiescki dysk — pomnik, jaki, na dumku vučonych, adnosicca da minojskaj kultury. Rasšyfroŭka hetaha piśma dazvoliła b pralić śviatło na historyju narodaŭ, jakija im karystalisia.
Adnak z raźvićciom štučnaha intelektu navukoŭcy atrymlivajuć absalutna novyja mahčymaści. Daśledčyki z dvuch izrailskich univiersitetaŭ stvaryli madel niejronnaha mašynnaha pierakładu, jakaja moža pierakładać piśmovuju akadskuju movu, jakuju ciažka rasšyfravać.
Akadskaja mova naležyć da hrupy siemickich moŭ, jana vykarystoŭvałasia ŭ Miesapatamii ź siaredziny III tysiačahodździa da našaj ery da pačatku I tysiačahodździa našaj ery.
Vykarystańnie madeli dazvalaje chutka i adnosna efiektyŭna čytać klinapis z tabličak, sabranych archieołahami za apošnija dźvieście hadoŭ. Samym staražytnym ź ich — kala piaci tysiač hadoŭ. U muziejach, univiersitetach i navukovych ustanovach usiaho śvietu na siońnia zachoŭvajecca kala 500 tysiač hlinianych tabličak z klinapisam.
Svaimi dasiahnieńniami vučonyja padzialilisia ŭ navukovym artykule, apublikavanym u časopisie PNAS Nexus.
U svaim artykule daśledčyki adznačajuć, što pierakład — heta składany praces, bo zvyčajna patrabujecca nie tolki ekśpiertnaje vałodańnie dźviuma roznymi movami, ale i viedańnie roznaha kulturnaha asiarodździa.
Ličbavyja instrumienty, jakija mohuć dapamahčy ŭ pierakładzie, stanoviacca ŭsio bolš raspaŭsiudžanymi. Heta źviazana z prahresam u takich halinach, jak aptyčnaje raspaznavańnie simvałaŭ i mašynny pierakład.
Adnak staražytnyja movy pa-raniejšamu ŭjaŭlajuć vialikuju prablemu ŭ hetym płanie. Ich pračytańnie i razumieńnie patrabuje viedaŭ daŭno pamierłaj moŭnaj supolnaści, da taho ž sami teksty taksama mohuć być vielmi frahmientarnymi.
Madel niejronnaha mašynnaha pierakładu, jakuju raspracavali vučonyja, zasnavanaja na apracoŭcy piśmovaj movy i hłybokim navučańni, jakoje zasnavana na t. zv. zhortačnaj niejronnaj sietcy (convolutional neural networks), što była śpiecyjalna raspracavanaja dla efiektyŭnaha raspaznavańnia vobrazaŭ.
Jaje meta — kaapieracyja čałavieka i mašyny, stvareńnie tak zvanaha kanviejera, ci paśladoŭnaści krokaŭ, jakija pieraŭtvarajuć akadskuju movu ŭ anhlijskuju. Jon pačynajecca z vyjavy klinapisnaj tablički i zakančvajecca jaje tranślitaracyjaj i pierakładam.
Vučonyja adznačajuć, što klinapisnyja znaki polivalentnyja, heta značyć, što kožny znak maje bolš, čym adno mahčymaje pračytańnie, i heta pračytańnie vyznačajecca papiarednim i nastupnym znakami. Jany navučyli madel mašynnaha navučańnia aŭtamatyčna vyznačać adpaviednaje pračytańnie i siehmientacyju.
Navukoŭcy dasiahnuli dakładnaści ad 89,5% da amal 97% u zaležnaści ad ałharytmu i vidu tekstu. Jak tłumačać daśledčyki, najlepšyja vyniki byli atrymanyja ŭ vypadku tekstaŭ z zahadzia vyznačanaj strukturaj, naprykład, carskich ukazaŭ. Horš było z paetyčnymi tekstami. U hetym vypadku štučny intelekt šmat vydumvaŭ.
Akramia taho, madel dasiahaje najlepšych vynikaŭ u karotkich i siarednich pa kolkaści słoŭ skazach (kala 118 znakaŭ abo mienš). Pa miery pavieličeńnia kolkaści aličbavanych tekstaŭ vyniki mohuć być palepšanyja šlacham dalejšaha navučańnia ŭ ramkach sistemy «čałavieka ŭ cykle», što dazvalaje karektavać pracu štučnaha intelektu.
Ciapier madel dastupnaja anłajn, a jaje zychodny kod možna znajści na GitHub u Akkademi. Dla taho, kab zrabić svoj kanviejer bolš dastupnym, vučonyja realizavali jaho funkcyjanalnaść u vyhladzie anłajn-dadatku pad nazvaju Babylonian Engine.
Vučonyja płanujuć, što praź niekalki hadoŭ (choć jany nie mohuć skazać dakładna, praz kolki) u vypadku, kali archieołahi i fiłołahi buduć na raskopkach i znojduć novy archiŭ klinapisnych tekstaŭ, jany zmohuć sfatahrafavać kožnuju tabličku i atrymać prybliznuju tranślitaracyju i pierakład tekstaŭ. Prahrama zmoža pa počyrku prapanavać mahčymuju datu stvareńnia tekstu, nazavie navat imia mierkavanaha pisca abo hrupy piscoŭ, vyznačyć žanr i šmat čaho inšaha.
Navukoŭcy płanujuć stvaryć anłajn-instrumienty dla redahavańnia klinapisnych tekstaŭ, kab daśledčyki mahli vypraŭlać i palapšać pieršapačatkovyja vyniki. U płanach taksama stvareńnie virtualnych turaŭ pa staražytnych stalicach i stepach Miesapatamii i Anatolii, što moža pieraŭtvaryć praces navučańnia ŭ hulniu dla studentaŭ.
Heta moža pieraŭtvaryć asiryjałohiju z vuzkaśpiecyjalizavanaj temy ŭ adnu z tych, što najbolš vyvučajucca, značna paskoryć praces daśledavańnia i ŭ razy pavialičyć našy viedy pra adno z samych staražytnych i raźvitych hramadstvaŭ u śviecie.
Čytajcie jašče:
Navukoŭcy narešcie rasšyfravali pačatak tajamničaha manuskrypta Vojniča XV stahodździa
Jak navukoŭcy sprabujuć navučyć kampjutar movie žestaŭ
Navukoŭcy rasšyfravali nadpis na staražytnaj movie ŭzrostam 3200 hadoŭ
Kamientary