teema: Tähenduspõhise keeletöötluse ressursid ja töövahendid eesti keele jaoks
tunnusnumber: ETF5534
projekti tüüp: Eesti Teadusfondi grant
erialad: 6. Humanitaarteadused
seisund: käimasolev
asutus: TÜ Filosoofiateaduskond
projekti juht: Haldur Õim
kestus: 01.01.2003 - 31.12.2006
kirjeldus: Käesoleva grandi põhieesmärk on kujundada süstemaatiline pilt tähenduspõhistest keeletöötluse suundadest ja vahenditest ning nende poolt esitatavatest nõuetest, rakendatuna eesti keelele. Tähenduspõhine (concept based) lähenemine keeletöötlusele on keeletehnoloogias viimastel aastatel väga kiiresti arenenud, selle raames on kujunenud täiesti uued suhted keeletehnoloogia ja teoreetilise keeleteaduse vahel. On tekkinud vajadus neist arengusuundadest ülevaade saada ja koostada programm nende rakendamiseks eesti keele arvutitöötluses. Teiseks eesmärgiks on arendada konkreetseid uurimis- ja arendustöid valdkondades, mis on ette teada olevalt tähenduspõhise lähenemise aluseks: 1, semantiline kirjeldussüsteem (metakeel) - semantilised kategooriad (ontoloogia), nende seosed; 2. semantika ja süntaksi seosed (süntaktiliste konstruktsioonide semantika); 3. sõnaliikide semantika; 4. semantiline ühestamine (olemasoleva programmi täiustamine, alternatiivsete programmide katsetamine). Need tööd eeldavad järgmiste olemasolevate keeleressursside olulist edasiarendamist: 1) semantiline andmebaas (tesaurus, wordnet) - täiendatud vähemalt 30 000 üksuseni, 2) semantiliselt ühestatud tekstikorpus (ühestatud nii nimi-, tegu-, kui ka omadussõnad) - täiendatud 100000 üksuseni.

projektiga seotud isikud
nr nimi asutus amet  
1.Neeme KahuskTartu Ülikoolteadur 
2.Kaarel KaljurandTartu Ülikooldoktorant 
3.Heili OravTartu Ülikoolteadur 
4.Kadri ViderTartu Ülikoolteadur 
5.Haldur ÕimTÜ Filosoofiateaduskondprofessor