Arhiva časopisa

Stručni rad

Marko Tadić; Zavod za lingvistiku Filozofskoga fakulteta, Zagreb

 

Sažetak

Članak daje pregled obradbe hrvatskih korpusa. Navode se najvažniji korpusni projekti od prvoga hrvatskoga računalno podržanoga korpusa - Gundulićev Osman (Bujas 1967), preko Moguševa milijunskoga korpusa do današnjih dana. Nadalje se rad usredotočuje na Hrvatski nacionalni korpus koji je središnji projekt na području korpusne lingvistike u Hrvatskoj danas. Hrvatski nacionalni korpus (Tadić 1996) čine dvije sastavnice: 1) reprezentativni 30-milijunski korpus suvremenoga hrvatskoga jezika (30M) i 2) Hrvatski elektronski tekstovni arhiv (HETA). U prvoj fazi sastavljanja Hrvatskoga nacionalnoga korpusa naglasak je na zaokruživanju 30-milijunskoga korpusa, dok će se u drugoj fazi sav napor preusmjeriti na širenje
obuhvata Hrvatskoga elektronskog tekstovnoga arhiva. U sadašnjem stanju rad na 30-milijunskom korpusu, koji bi trebao biti završen 2000, u fazi je uznapredovala planiranja i javnoga testiranja probne inačice korpusa (7,68 milijuna pojavnica) putem WWW-a.

 

Articles download statistics

Kontakt časopisa

Adresa:
Ivana Lučića 3
10000 Zagreb
Croatia

Glavni kontakt:
Mislava Bertoša
Email: Ova e-mail adresa je zaštićena od spambota. Potrebno je omogućiti JavaScript da je vidite.

Visitorcounter

Today 0

Week 125

Month 477

All 316559

Currently are 93 guests and no members online