početna
predgovor
uvod
o području
opis sustava
implementacija
višejezičnost
zaključak
literatura
o studentima

>> Višejezičnost sustava SPID

Jedna od bitnih razlika našeg sustava u odnosu na neke slične postojeće sustave jest podrška za višejezičnost. Korisnicima je omogućeno biranje različitih jezika u tri dijela sustava. Prvo, može se kontrolirati jezik cijelog korisničkog sučelja, čime se omogućava korištenje sustava i izvan granica Hrvatske. Omogućeno je vrlo jednostavno prevođenje programa – u vanjskim tekstovnim datotekama navode se prijevodi svakog korisničkog elementa.

Slika 20. Sučelje programa SPID na engleskom jeziku

Nadalje, može se birati jezik kojim će se prikazivati pojmovnik Eurovoca - višejezičnost je podržana u samom formatu pojmovnika i u XML formatu i u ISIS bazi. Na kraju, podržana je i višejezičnost dokumenata. Naime, nije dovoljno samo prikazati dokument, već se funkcije vezane uz obradu jezika trebaju prilagoditi. Morfologija se razlikuje od jezika do jezika, tako da je potrebno podržati različite jezike u postupku lematizacije. Korisnicima je omogućeno biranje jezika, te biranje načina lematizacije (slika 21). Posebno za engleski jezik omogućeno je i korištenje Porterovog algoritma.

Slika 21. Odabran je engleski jezik te lematizacija rječnikom. Neke najčešće riječi se ignoriraju, pa se ne prikazuju u listi lema i različnica.

Budući da su određeni dokumenti vrlo specifični i da nije svaki indeksator dobro upoznat sa svakim područjem, u nekim slučajevima se koristi pojmovnik da se dobiju dodatne informacije o pojmovima. To je posebno istaknuto kada je dokument, koji se treba indeksirati, pisan na drugom stranom jeziku. Na slici 22 prikazan je primjer paralelnog rada sustava na dva jezika: rezultati izlučivanja deskriptora iz teksta na engleskom jeziku koriste se kako bi se brzo našle informacije o traženom pojmu na hrvatskom jeziku.

Trenutno su jedini podržani jezici hrvatski i engleski, iako dodavanje novog jezika nije složeno. Rad sustava na drugim jezicima podrazumijeva: postojanje Eurovoca na tom jeziku (već postoji na 22 jezika), prevedeno sučelje i morfološki leksikon za drugi jezik (postoji za većinu europskih jezika).

Slika 22. U dokumentu pisanom na engleskom jeziku sustav je pronašao deskriptor "principles of subsidiarity". Korisnik može pronaći isti deskriptor u Eurovocu na hrvatskom jeziku te vidjeti dodatne informacije.