GRASP

Назив пројекта: ГРАФОВИ У ПРОСТОРУ: МАПИРАЊЕ ГРАФОВА ЗА МАШИНСКО УЧЕЊЕ НА КОМПЛЕКСНИМ ПОДАЦИМА

Акроним: GRASP

Руководилац пројекта: Др Милош Радовановић, ванредни професор, Природно-математички факултет, Универзитет у Новом Саду

Научноистраживачка организација: Природно-математички факултет, Универзитет у Новом Саду

Графови, односно мреже, помажу нам да схватамо свет који нас окружује. Тачке, тј. чворови графа, могу представљати ентитете – на пример, људе – док везе између тачака, тј. гране графа, изражавају неки однос или интеракцију – рецимо, познанство – између њих. На сличан начин се готово свака појава, од нивоа атома до нивоа галаксија, може моделовати у форми графа.

Једна од најважнијих операција која је доступна код графова јесте њихова трансформација у „традиционалну“ форму података – табелу. Применом „класичних“ табеларних техника вештачке интелигенције и анализе података можемо стећи увиде до којих би било тешко или немогуће доћи директним посматрањем мрежа. Тако, уз помоћ опробаних табеларних техника на графу интеракција корисника Фејсбука, кориснике можемо класификовати у одређене категорије од интереса, идентификовати заједнице или препоручити пријатеље.

Традиционалне технике машинског учења и анализе података у овом случају су осетљиве на велики број колона у табели, за који се користи термин висока димензионалност. Та осетљивост – проклетство димензионалности – може довести до тешкоћа или неуспеха у раду.

Овај пројекат се бави негативним ефектима високе димензионалности на успешност мапирања графова и потоњу примену техника за класификацију, кластеринг, налажење сличних ентитета и предвиђање нових веза.

ЦИЉ ПРОЈЕКТА: Мапирање графова које ће омогућити примену широког спектра техника машинског учења и анализе података на графове или мреже.

МЕТОДОЛОГИЈА: Током реализације пројекта примењиваће се технике машинског учења, технике за брзу претрагу и предвиђање веза и постојеће, али и нове технике за мапирање графова.

ОЧЕКИВАНИ РЕЗУЛТАТИ: Реч је о новим техникама за мапирање графова које узимају у обзир димензионалност њихове табеларне репрезентације, као и о бесплатним софтверским алатима отвореног кода.

Илустрација: Моника Ланг