Пошук іншапланетнага жыцця — гэта, па сутнасці, праблема сартавання даных. Машыннае навучанне можа быць магчымым рашэннем.
Дзейнасць даследчыкаў па пошуку пазаземнага розуму, альбо SETI (search for extraterrestrial intelligence) паскараецца і робіцца прасцейшай дзякуючы развіццю машыннага навучання.
У артыкуле, апублікаваным на мінулым тыдні ў Nature Astronomy, каманда даследчыкаў на чале з Пітэрам Ма з Універсітэта Таронта падзялілася метадам машыннага навучання для прагляду даных з праекта Breakthrough Listen для ідэнтыфікацыі сігналаў, якія могуць быць патэнцыйнымі тэхнасігнатурамі — гэта значыць, індыкатарамі тэхналагічнай складанасці, якія могуць сведчыць аб разумнай іншапланетнай цывілізацыі.
Даследаванне Ма сканцэнтраванае на пэўнай частцы электрамагнітнага спектра, якая завецца вузкапалосным радыё. У той час, як усе віды аб'ектаў у Сусвеце выпраменьваюць радыяцыю ў шырокім дыяпазоне частот, радыёчастоты асабліва эфектыўныя для перадачы сігналаў. І калі мы размаўляем з дапамогай радыёхваль, то выкарыстоўваем вузкую паласу радыёчастот, бо гэта больш эфектыўна.
Даследчыкі SETI мяркуюць, што іншапланетныя цывілізацыі, калі яны існуюць, рабілі б тое ж самае. Спадар Ма кажа, што з пункту гледжання тэхналогіі для любой разумнай цывілізацыі, якая таксама спрабуе перадаваць сігналы праз электрамагнітнае выпраменьванне, напрыклад, праз радыё, мае сэнс выкарыстоўваць менавіта вузкія дыяпазоны.
Даследчыкі SETI цікавяцца асобнай часткай радыёдыяпазону — каля 1420 МГц. Вядомы як «вадародная лінія», гэты дыяпазон важны для астраномаў, таму што гэта частата, на якой нейтральны вадарод выпускае выпраменьванне, таму гэта ключ да вывучэння разнастайных астранамічных цэляў.
Даследчыкі мяркуюць, што любая іншапланетная цывілізацыя, якая цікавіцца зоркамі, таксама з высокай доляй імавернасці будзе глядзець на гэты дыяпазон, што робіць яго так званым «галактычным вадапоем».
Калі б цывілізацыя спрабавала кантактаваць праз космас, то выкарыстанне гэтай частаты было б, бадай, найлепшай ідэяй.
Гэтае ўсведамленне было асновай для многіх даследаванняў SETI ў папярэднія гады: даследчыкі прачэсвалі даныя ў гэтым дыяпазоне часта з выкарыстаннем алгарытму пад назвай turboSETI, які праглядае графікі часу па частаце і шукае прамыя лініі, якія паказваюць на наяўнасць сігналу. Гэта даволі эфектыўны спосаб пошуку прыкмет штучных сігналаў у вялікай масе даных, але ён таксама мае праблемы, напрыклад, адфільтроўванне лжывых станоўчых вынікаў, выкліканых умяшаннем у пошук сігналаў зямнога паходжання.
Новы ж метад мае іншы падыход. Замест таго, каб шукаць гэтыя прамыя лініі, даследчыкі ўвялі ранейшыя арыгінальныя назіранні, а потым змадэлявалі сігналы, якія іх цікавяць, і навучылі свой алгарытм распазнаваць гэтыя сігналы для пошуку ў масе новых даных.
Гэта дазваляе выкарыстоўваць больш гнуткі падыход да распазнавання сігналаў, выяўляючы анамаліі ў вузкіх частотах, нават калі яны не маюць простай формы лініі, якую адзначаў бы традыцыйны алгарытм. Гэта робіць падыход больш хуткім і эфектыўным.
Гэта важна, бо SETI — гэта, па сутнасці, гульня лічбаў: задача ў тым, каб атрымаць як мага большую колькасць даных з як мага большай колькасці тэлескопаў, каб павялічыць шанцы на выяўленне сігналу іншаземнага паходжання. Прачэсванне ўсіх гэтых даных практычна ўяўляе сабой пошук іголкі ў касмічным стозе сена і патрабуе ўсё больш эфектыўных метадаў пошуку.
Так, даследчыкі могуць прысвяціць усю сваю кар'еру пошуку чагосьці, што можа існаваць, а можа і не існаваць. Такія новыя інструменты, як магутныя тэлескопы і метады машыннага навучання, могуць дапамагчы зрабіць пошук больш дакладным і выразным.
Пітэр Ма, не хаваючы захаплення, кажа, што для чалавека яшчэ не было лепшага часу ў гісторыі для пошуку пазаземных цывілізацый. Нароўні з магчымасцю ніколі не знайсці жыццё па-за межамі нашай планеты існуе таксама немалая імавернасць таго, што ўжо заўтра даследчыкі выявяць сігнал або нават доказы існавання іншапланетнай цывілізацыі, якія ўжо могуць прысутнічаць у вялізных аб’ёмах даных, сабраных за дзесяцігоддзі праслухоўвання неба.
І сённяшні скачок у развіцці машыннага навучання і нейронных сетак можа дапамагчы зрабіць працу значна хутчэй.
Каментары