S-ADAPT

Назив пројекта: АДАПТАЦИЈА ГОВОРНИКА И СТИЛА ГОВОРА ДИГИТАЛНИХ ГОВОРНИХ АСИСТЕНАТА ЗАСНОВАНА НА МЕТОДАМА ЗА ОБРАДУ СЛИКЕ

Акроним: S-ADAPT

Руководилац пројекта: Др Владо Делић, редовни професор, Факултет техничких наука, Универзитет у Новом Саду

Научноистраживачке организације: Факултет техничких наука, Универзитет у Новом Саду; Математички институт САНУ

Говорна комуникација између човека и машине, заснована на технологијама аутоматског препознавања говора, у једном смеру, и синтезе говора на основу текста, у другом, није подједнако флексибилна нити подједнако природна као говорна комуникација између људи. Овакав облик комуницирања не може довољно брзо и тачно да функционише у условима различите амбијенталне буке, али ни различитих гласова говорника и начина, односно стила говора. Пројекат S-ADAPT ће применом напредних метода вештачке интелигенције усавршити поменуте аспекте говорне комуникације човека и машине.

Аутоматско препознавање говора биће тачније и робустније, јер ће се адаптирати на пол и старост говорника, његов начин говора, као и на специфичности услова снимања. Технологија синтезе говора биће флексибилнија у погледу гласа говорника и његовог говорног стила, и то уз релативно малу количину података за адаптацију, што је веома важно јер је у реалним сценаријима на располагању обично мала количина говорног материјала.

Као директан резултат пројекта, широком кругу корисника у Србији и другим земљама биће омогућено да на свом матерњем језику флексибилно комуницирају са својим мобилним телефоном, а касније и са другим уређајима. Резултати истраживања биће верификовани кроз уградњу у постојећу апликацију дигиталног говорног асистента за мобилне телефоне.

ЦИЉ ПРОЈЕКТА: Имплементација алгоритама за адаптацију на говорника/стил у већ постојећег говорног асистента на српском језику.

МЕТОДОЛОГИЈА: Ослањање на технологије вештачке интелигенције, концепте машинског учења и алгоритме засноване на дубоким неуронским мрежама, посебно конволуционим неуронским мрежама.

ОЧЕКИВАНИ РЕЗУЛТАТИ: Унапређење флексибилности говорних технологија и употребљивости дигиталних говорних асистената, робота, паметних кућа, канцеларија и аутомобила.

Илустрација: Давид Билобрк