AVANTES

Назив пројекта: НОВА РЕШЕЊА У РАЗВОЈУ СОФТВЕРА ЗАСНОВАНА НА СЛИЧНОСТИ ТЕКСТОВА

Акроним: AVANTES

Руководилац пројекта: Др Бошко Николић, редовни професор, Електротехнички факултет, Универзитет у Београду

Научноистраживачке организације: Електротехнички факултет, Универзитет у Београду; Иновациони центар Електротехничког факултета, Универзитет у Београду; Филолошки факултет, Универзитет у Београду; Универзитет у Цириху

Интердисциплинарни истраживачки тим развиће интелигентни алат за препознавање семантичке сличности између делова софтверског система исписаних на програмским језицима и коментара на природним језицима. Посебну пажњу истраживачи ће усмерити на решавање проблема сличности између два текста различитих дужина, пре свега на српском, уз упоређивање са резултатима добијеним за енглески језик. Такође, реализовани систем ће моћи да препозна дупликате делова софтвера. За потребе пројекта користиће се нове методе за анализу програмског кода које подразумевају употребу техника машинског учења и вештачке интелигенције.

Осим алата за утврђивање сличности између делова софтвера и унесених коментара, група софтверских инжењера и лингвиста формираће и нови алгоритам за претрагу кода према значењу, тачније путем упита на природном језику (српском и енглеском).

Пројекат AVANTES од великог је значаја за Србију јер ће истраживачи формирати скупове анотираних података и увести иновације у постојеће технологије за обраду српског језика, за који је тренутно доступно далеко мање ресурса него за веће језике попут енглеског.

То ће олакшати рад софтверским инжењерима у нашој земљи, али и лингвистима који се баве истраживањем српског језика.

ЦИЉ ПРОЈЕКТА: Формирање скупова анотираних података и увођење иновација у постојеће технологије за напредну аутоматску обраду српског језика.

МЕТОДОЛОГИЈА: Реализоваће се новe методe за анализу програмског кода применом техника машинског учења и вештачке интелигенције. Анализираће се препознавање семантичке сличности коментара делова софтвера, као и сличности између текстова различитих дужина.

ОЧЕКИВАНИ РЕЗУЛТАТИ: Нови алат за утврђивање сличности софтвера. Нови алгоритам за претрагу кода према значењу путем упита на природном језику. Алгоритам за препознавање сличности текстова различитих дужина. Скупови података и модели за аутоматску обраду српског језика.

Илустрација: Ивана Бугариновић