početna
predgovor
uvod
o području
opis sustava
implementacija
višejezičnost
zaključak
literatura
o studentima

>> Implementacija >> Generiranje vizualne rekonstrukcije na temelju unutarnje strukture

Kao što je vidljivo iz primjera u poglavlju 4.1., ukoliko je dokument na ulazu prikladno pretprocesiran, unutar njega spremljene su dodatne informacije o vizualnom formatiranju dokumenta. Zahvaljujući unutarnjoj strukturi sustava, pomoću tih informacija jednostavno je konstruirati vizualnu reprezentaciju strukture.

Jedno od temeljnih svojstava XML formata, kao jezika temeljenog na oznakama, jest da XML oznake nasljeđuju semantička svojstva oznake u kojoj su ugniježđena. Jedno od takvih semantičkih svojstava jest upravo i način vizualnog formatiranja.

Ova osobina izravno se prenosi na implementiranu stablastu strukturu na način da svi čvorovi-djeca nasljeđuju formatiranje od čvora-roditelja. Konkretno, ukoliko je unutar nekog nezavršnog čvora, oznakom stil određen način vizualnog formatiranja, sav tekst koji se nalazi u čvorovima-djeci biti će formatiran u skladu s istim.

Na žalost, zbog već spominjane raznolikosti izvora i načina formatiranja ulaznih dokumenata, nije bilo moguće pouzdati se u činjenicu da će svaki dokument u sebi nositi i semantičke informacije o vizualnoj reprezentaciji, u vidu stil atributa. Naravno, nedostatak tih oznaka nimalo ne utječe na rad niti korisnost sustava, budući je jedini uvjet na ulaz u sustav podvrgavanje XML standardu zapisa. No, želeći u najvećoj mogućoj mjeri olakšati korisnicima rad sa sustavom i učiniti ga što je moguće ugodnijim, u sustav je ugrađen dodatni mehanizam zadavanja načina formatiranja ulaznih dokumenata koji u sebi iz bilo koji razloga nemaju zapisanu informaciju o formatiranju.

Slika 12. Dijalog za određivanje načina formatiranja dokumenata koji u sebi nemaju zapisanu informaciju o vizualnoj reprezentaciji. Prikazan je primjer kojim je pomoću pravila omogućena oku ugodna vizualna rekonstrukcija određenih dokumenata u kojima nedostaju informacije o formatiranju.

Zamisao o omogućavanju korisnički definiranih stilova formatiranja ulaznih dokumenata jest upravo simuliranje predviđenog mehanizma. No, umjesto da su informacije o formatiranju pojedinih oznaka spremljene u samoj oznaci, u vidu atributa stil, one su spremljene u vanjskoj datoteci, koja se uređuje u posebnom dijalogu unutar sustava, prikazanom na slici 12.

Svaka datoteka s korisnički definiranim načinima formatiranja ulaznih dokumenata sastoji se od skupa pravila. Svako pravilo formatiranja sastoji se od pet atributa :

• Naziv XML oznake na koju se odnosi pravilo.
• Ime vrste slova (fonta) koju treba primijeniti prilikom generiranja vizualne reprezentacije za tekst unutar oznake na koju se odnosi pravilo.
• Veličina slova koju treba primijeniti.
• Boju slova koju treba primijeniti.
• Poravnanje koje treba primijeniti.

Samo generiranje vizualne reprezentacije zahtjeva minimalne promjene. Nailaskom na XML oznaku za koju treba saznati način vizualnog formatiranja, umjesto referenciranja na skup stilova definiran u dokumentu prema broju stila, sustav se referencira na vanjsku datoteku s korisnički definiranim načinima formatiranja, prema imenu oznake.