Štučny intelekt dapamoh pračytać tablički z klinapisam, jakim piać tysiač hadoŭ

Madel, stvoranaja archieołahami i śpiecyjalistami pa mašynnym navučańni, maje šaniec zrabić revalucyju ŭ daśledavańniach najstaražytniejšaj piśmiennaści, stvoranaj čałaviectvam.

04.07.2023 / 22:15

Hlinianaja tablička z Šurupaka z tekstam ab prodažy pola i doma, kala 2600 h. da n. e. Fota: Wikimedia Commons

Da siońnia mnohija staražytnyja piśmovyja sistemy zastajucca nierasšyfravanymi. Siarod ich piśmo cyvilizacyi daliny Inda, liniejnaje piśmo A, jakim karystalisia staražytnyja žychary Kryta, a taksama piśmo, jakoje naniesiena na Fiescki dysk — pomnik, jaki, na dumku vučonych, adnosicca da minojskaj kultury. Rasšyfroŭka hetaha piśma dazvoliła b pralić śviatło na historyju narodaŭ, jakija im karystalisia.

Adnak z raźvićciom štučnaha intelektu navukoŭcy atrymlivajuć absalutna novyja mahčymaści. Daśledčyki z dvuch izrailskich univiersitetaŭ stvaryli madel niejronnaha mašynnaha pierakładu, jakaja moža pierakładać piśmovuju akadskuju movu, jakuju ciažka rasšyfravać.

Akadskaja mova naležyć da hrupy siemickich moŭ, jana vykarystoŭvałasia ŭ Miesapatamii ź siaredziny III tysiačahodździa da našaj ery da pačatku I tysiačahodździa našaj ery.

Vykarystańnie madeli dazvalaje chutka i adnosna efiektyŭna čytać klinapis z tabličak, sabranych archieołahami za apošnija dźvieście hadoŭ. Samym staražytnym ź ich — kala piaci tysiač hadoŭ. U muziejach, univiersitetach i navukovych ustanovach usiaho śvietu na siońnia zachoŭvajecca kala 500 tysiač hlinianych tabličak z klinapisam.

Svaimi dasiahnieńniami vučonyja padzialilisia ŭ navukovym artykule, apublikavanym u časopisie PNAS Nexus.

U svaim artykule daśledčyki adznačajuć, što pierakład — heta składany praces, bo zvyčajna patrabujecca nie tolki ekśpiertnaje vałodańnie dźviuma roznymi movami, ale i viedańnie roznaha kulturnaha asiarodździa.

Ličbavyja instrumienty, jakija mohuć dapamahčy ŭ pierakładzie, stanoviacca ŭsio bolš raspaŭsiudžanymi. Heta źviazana z prahresam u takich halinach, jak aptyčnaje raspaznavańnie simvałaŭ i mašynny pierakład.

Adnak staražytnyja movy pa-raniejšamu ŭjaŭlajuć vialikuju prablemu ŭ hetym płanie. Ich pračytańnie i razumieńnie patrabuje viedaŭ daŭno pamierłaj moŭnaj supolnaści, da taho ž sami teksty taksama mohuć być vielmi frahmientarnymi.

Madel niejronnaha mašynnaha pierakładu, jakuju raspracavali vučonyja, zasnavanaja na apracoŭcy piśmovaj movy i hłybokim navučańni, jakoje zasnavana na t. zv. zhortačnaj niejronnaj sietcy (convolutional neural networks), što była śpiecyjalna raspracavanaja dla efiektyŭnaha raspaznavańnia vobrazaŭ.

Jaje meta — kaapieracyja čałavieka i mašyny, stvareńnie tak zvanaha kanviejera, ci paśladoŭnaści krokaŭ, jakija pieraŭtvarajuć akadskuju movu ŭ anhlijskuju. Jon pačynajecca z vyjavy klinapisnaj tablički i zakančvajecca jaje tranślitaracyjaj i pierakładam.

Vučonyja adznačajuć, što klinapisnyja znaki polivalentnyja, heta značyć, što kožny znak maje bolš, čym adno mahčymaje pračytańnie, i heta pračytańnie vyznačajecca papiarednim i nastupnym znakami. Jany navučyli madel mašynnaha navučańnia aŭtamatyčna vyznačać adpaviednaje pračytańnie i siehmientacyju.

Navukoŭcy dasiahnuli dakładnaści ad 89,5% da amal 97% u zaležnaści ad ałharytmu i vidu tekstu. Jak tłumačać daśledčyki, najlepšyja vyniki byli atrymanyja ŭ vypadku tekstaŭ z zahadzia vyznačanaj strukturaj, naprykład, carskich ukazaŭ. Horš było z paetyčnymi tekstami. U hetym vypadku štučny intelekt šmat vydumvaŭ.

Akramia taho, madel dasiahaje najlepšych vynikaŭ u karotkich i siarednich pa kolkaści słoŭ skazach (kala 118 znakaŭ abo mienš). Pa miery pavieličeńnia kolkaści aličbavanych tekstaŭ vyniki mohuć być palepšanyja šlacham dalejšaha navučańnia ŭ ramkach sistemy «čałavieka ŭ cykle», što dazvalaje karektavać pracu štučnaha intelektu.

Ciapier madel dastupnaja anłajn, a jaje zychodny kod možna znajści na GitHub u Akkademi. Dla taho, kab zrabić svoj kanviejer bolš dastupnym, vučonyja realizavali jaho funkcyjanalnaść u vyhladzie anłajn-dadatku pad nazvaju Babylonian Engine.

Vučonyja płanujuć, što praź niekalki hadoŭ (choć jany nie mohuć skazać dakładna, praz kolki) u vypadku, kali archieołahi i fiłołahi buduć na raskopkach i znojduć novy archiŭ klinapisnych tekstaŭ, jany zmohuć sfatahrafavać kožnuju tabličku i atrymać prybliznuju tranślitaracyju i pierakład tekstaŭ. Prahrama zmoža pa počyrku prapanavać mahčymuju datu stvareńnia tekstu, nazavie navat imia mierkavanaha pisca abo hrupy piscoŭ, vyznačyć žanr i šmat čaho inšaha.

Navukoŭcy płanujuć stvaryć anłajn-instrumienty dla redahavańnia klinapisnych tekstaŭ, kab daśledčyki mahli vypraŭlać i palapšać pieršapačatkovyja vyniki. U płanach taksama stvareńnie virtualnych turaŭ pa staražytnych stalicach i stepach Miesapatamii i Anatolii, što moža pieraŭtvaryć praces navučańnia ŭ hulniu dla studentaŭ.

Heta moža pieraŭtvaryć asiryjałohiju z vuzkaśpiecyjalizavanaj temy ŭ adnu z tych, što najbolš vyvučajucca, značna paskoryć praces daśledavańnia i ŭ razy pavialičyć našy viedy pra adno z samych staražytnych i raźvitych hramadstvaŭ u śviecie.

Čytajcie jašče:

Navukoŭcy narešcie rasšyfravali pačatak tajamničaha manuskrypta Vojniča XV stahodździa

Jak navukoŭcy sprabujuć navučyć kampjutar movie žestaŭ

Navukoŭcy rasšyfravali nadpis na staražytnaj movie ŭzrostam 3200 hadoŭ

Antoś Župran