Навука і тэхналогіі

Яшчэ крок да галасавога кіравання машынамі: штучны інтэлект навучыўся распазнаваць галоўны голас сярод некалькіх

Mitsubishi Electric Corporation абвясціла, што яна стварыла першую ў свеце тэхналогію, якая аддзяляе, а затым рэканструюе з высокай якасцю адначасовы выступ некалькіх людзей, запісаных з дапамогай аднаго мікрафона ў рэжыме рэальнага часу.

У тэстах адначасовыя выступы двух і трох чалавек, былі падзеленыя з дакладнасцю да 90 і 80 адсоткаў адпаведна, што кампанія лічыць вялікім дасягненнем. Новая тэхналогія, якая была рэалізаваная пры дапамозе запатэнтаванага Mitsubishi Electric метадам Deep Clustering на аснове штучнага інтэлекту, як чакаецца, будзе спрыяць больш якаснай галасавой сувязі і больш дакладнаму аўтаматычнаму распазнаванню гаворкі.

У выпадку з двума адначасовымі спікерамі, дакладнасць перавысіла 90%, што больш чым дастаткова для якаснай працы гэтай тэхналогіі, асабліва ў параўнанні з дакладнасцю 51%, якая была дасягнутая раней з выкарыстаннем традыцыйнай тэхналогіі.

Новая тэхналогія здольная адрозніваць нават спалучэнні некалькіх найбольш распаўсюджаных моваў, а таксама галасы мужчын, жанчын і дзяцей.

Прыведзеныя вышэй вынікі заснаваныя на ідэальных умовах запісу, у тым ліку пры нізкім ўзроўнем шуму навакольнага асяроддзя і прыкладна аднолькавай гучнасцю галасоў спікераў.

Тэхналогія Deep Clustering выкарыстоўвае уласны метад Mitsubishi Electric, каб даведацца, як кадаваць кампаненты сігналу зыходных маўленчых дадзеных некалькіх людзей, так што кампаненты сігналу, якія адносяцца да кожнага асобнага чалавека, можна лёгка адрозніць па іх кадзіроўцы.

Па словах аўтараў праекту Энтані Ветра і Ёхеі Окато, у большасці сістэм задача падзелу галасоў вырашаецца пры дапамозе ўстаноўкі двух або большай колькасці мікрафонаў, але ў выпадку выкарыстання ўсяго аднаго мікрафона, з задачай падзелу голасу можа справіцца толькі штучны інтэлект. 

Выкарыстоўваць гэтую тэхналогію можна там, дзе патрабуецца высокая дакладнасць распазнавання галасавых паведамленняў, напрыклад, у сістэмах галасавога кіравання аўтамабілямі, ліфтамі, бытавымі і іншымі электроннымі прыладамі.

Каментары

З кастрычніка новы пакет санкцый запрацуе напоўніцу. Як да гэтай даты рыхтуюцца бізнэс і грузаперавозчыкі?

З кастрычніка новы пакет санкцый запрацуе напоўніцу. Як да гэтай даты рыхтуюцца бізнэс і грузаперавозчыкі?

Усе навіны →
Усе навіны

Блогер Vadimati пасля вызвалення знайшоў працу на рынку

«З 1 кастрычніка ніхто працаваць не будзе». У Беларусі зачыняюцца прыватныя дамы састарэлых10

Пасля аварыі на вадаводзе ў Мінску пагоршала якасць вады

На літоўскай мяжы з'явіліся чэргі з легкавых аўто

Пашкоджаны вадавод у Мінску адрамантавалі. Але праблемы з якасцю вады пакуль застаюцца

Сёння той самы дзень, калі беларусам настойліва не рэкамендавалася хадзіць у лес4

Трамп анансаваў сустрэчу з Зяленскім у «Вежы Трампа»5

«Ваяваў я за Беларусь і веру ў яе шчаслівую будучыню». 100-годдзе святкуе прафесар-медык Іван Данілаў, сапраўдны ветэран13

Суд у Польшчы асудзіў беларуса на два гады за шпіянаж на карысць Расіі12

больш чытаных навін
больш лайканых навін

З кастрычніка новы пакет санкцый запрацуе напоўніцу. Як да гэтай даты рыхтуюцца бізнэс і грузаперавозчыкі?

З кастрычніка новы пакет санкцый запрацуе напоўніцу. Як да гэтай даты рыхтуюцца бізнэс і грузаперавозчыкі?

Галоўнае
Усе навіны →