Projekt primjene informacijske tehnologije
Ministarstva znanosti, obrazovanja i športa
2003 - 2005

Text Mining System - Sustav za automatsko indeksiranje, kategorizaciju i semantičko pretraživanje teksta


Kratki opis projekta

Prisutnost sve većeg broja nestrukturiranih tekstualnih dokumenata (posebno na nehomogenim izvorima kao što je WWW) dovodi nas u situaciju u kojoj je iz mase podataka teško izvući korisnu informaciju. Zbog toga postoji sve veća potreba za inteligentnim raspoznavanjem teksta i kategorizacijom tekstualnih uzoraka.
Pod pojmom inteligentno ili semantičko pretraživanje teksta podrazumijeva se pretraživanje koje na zadani upit pronalazi odgovarajuće tekstove (ili grupira slične dokumente) po značenju, a ne leksički. Semantičkim se pretraživanjem rješava problem sinonima i homonima koji predstavljaju glavnu prepreku učinkovitom pretraživanju.


Praktični cilj

Razvoj sustava za automatsko indeksiranje, automatsku kategorizaciju i semantičko pretraživanje tekstualnih podataka kao što su znanstveni, stručni ili novinski članci, bibliografije, i web stranice. Sustav će biti testiran na kolekcijama dokumenata na engleskom jeziku koje su formirane u znanstvene svrhe.
Posebno će se testirati rad sustava nad tekstualnom bazom podataka na hrvatskom jeziku, kao što su to novinski članci ili Hrvatska znanstvena bibliografija.


Edukativni cilj

Poticanje studenata FER-a na izravnu primjenu teorijskog znanja iz područja inteligentnih sustava, strojnog učenja, statistike i otkrivanja znanja u skupovima podataka. Studenti će u okviru nastave sudjelovati u izgradnji sustava primjenjujući algoritme za dubinsku analizu podataka i teksta (data and text mining).


Voditelj projekata

Prof. dr. sc. Bojana Dalbelo Bašić
E-mail: bojana.dalbelo@fer.hr


Suradnici na projektu

Prof.dr.sc. Slobodan Ribarić, Fakultet elektrotehnike i računarstva

Jan Šnajder, dipl.ing., Fakultet elektrotehnike i računarstva

Prof.dr.sc. Marko Tadić, Filozofski fakultet Zagreb

Mr.sc. Jasminka Dobša, Fakultet organizacije i informatike

Mr.sc. Jadranka Stojnovski, Instutut "Ruđer Bošković"


Bivši studenti FER-a koji su diplomirali na temi vezanoj uz projekt

Renee Ahel, dipl. ing.
Mislav Malenica, dipl. ing.
Ana Cvitaš
Boris Bereček
Dajana Buršić


Studenti V. godine studija Računarstva

Josip Bakić
Perica Baškarić
Marko Bjelac
Stjepan Buljat
Emina Elezović
Irena Kezić
Ante Parlov
Franjo Skočec
Luka Šurija
Domagoj Tominac
Milan Tribuson


Studenti IV. godine studija Računarstva

Butić Ante
Eklić Hrvoje
Ivankov Joško
Jančec Matija
Jovanov Goran
Kolar Mladen
Mijić Jure
Šarić Frane
Vukmirović Igor


© Sva prava pridrana. FER 2004