Pregledni rad
Božo Bekavac
Sažetak
U članku se daje cjelovit pregled radova iz područja strojnog obilježavanja hrvatskih tekstova. Pregled obuhvaća opojavničenje, segmentaciju na rečenice, lematizaciju, POS i MSD označavanje, prepoznavanje naziva i problematiku leksikona. Osim izloženih gotovih radova za svaku cjelinu posebno, upućuje se na slične radove i dodatne izvore, te se daju ideje i smjernice za buduće korake. U zaključku se ističe nužnost poštivanja međunarodnih standarda za obilježavanje tekstova u razvoju jezičnih resursa i računalnojezikoslovnih alata za hrvatski jezik.
Ključne riječi
strojno obilježavanje, jezikoslovni alati, jezični resursi, korpusna lingvistika, hrvatski jezik