početna
predgovor
uvod
o području
opis sustava
implementacija
višejezičnost
zaključak
literatura
o studentima

>> Dubinska analiza teksta i indeksiranje dokumenata pojmovnikom Eurovoc >> pojmovnik Eurovoc

Pojmovnik Eurovoc (EUROpean VOCabulary) je hijerarhijski organizirani, multidisciplinarni pojmovnik sastavljen od 21 područja i 127 potpodručja koje obuhvaćaju sve djelatnosti Europske unije u obliku strukturiranoga i kontroliranoga popisa naziva za sve važne pojmove koji se javljaju u najrazličitijim dokumentima EU-a [17]. Eurovoc je preveden na 20 službenih jezika EU-a, a dodatno su ga prevele i neke druge zemlje, među kojima je i Hrvatska [18]. Hidra je napravila dodatak pojmovniku kako bi se lakše indeksirali dokumenti vezani uz Hrvatsku. Dodan je niz pojmova vezanih uz županije, političke stranke, razne institucije kojih nema u Eurovocu, itd.

Slika 1. Na službenoj stranici Eurovoca, http://europa.eu.int/celex/eurovoc/, nudi se izbor jednog od 20 jezika zemalja EU-a čije institucije koriste Eurovoc. Također, ponuđeni su i jezici nečlanica Rumunjske i Hrvatske, kao posebno priznanje dvjema zemljama za napore koje ulažu u uvođenje Eurovoca u svakodnevnu praksu.

Pojmovi ili termini u Eurovocu često se nazivaju deskriptori (engl. descriptor) jer se odabirom određenih deskriptora opisuje (engl. describe) dokument. Ponekad se neki pojam u tekstu nalazi u različitim oblicima, pa zato određeni deskriptori imaju uz sebe vezane asocijate – različite termine kojima se opisuje isti pojam. Asocijati nisu zasebni elementi pojmovnika, već su uvijek vezani uz točno određeni deskriptor.

Eurovoc sadrži brojne relacije (veze) među pojmovima, od kojih je najvažnija hijerarhijska. Na vrhu hijerarhije nalazi se 21 područje, zatim 127 potpodručja, pa tek onda dolaze na red deskriptori. Često deskriptori sadrže veze na srodne deskriptore, srodne, ali uže pojmove, i sl. Koriste se i veze prije i poslije, tako da se npr. staro ime stranke može povezati sa novijim imenom.