teema: | Tähenduspõhise keeletöötluse ressursid ja töövahendid eesti keele jaoks |
---|---|
tunnusnumber: | ETF5534 |
projekti tüüp: | Eesti Teadusfondi grant |
erialad: |
6. Humanitaarteadused |
seisund: | käimasolev |
asutus: | TÜ Filosoofiateaduskond |
projekti juht: | Haldur Õim |
kestus: | 01.01.2003 - 31.12.2006 |
kirjeldus: | Käesoleva grandi põhieesmärk on kujundada süstemaatiline pilt tähenduspõhistest keeletöötluse suundadest ja vahenditest ning nende poolt esitatavatest nõuetest, rakendatuna eesti keelele. Tähenduspõhine (concept based) lähenemine keeletöötlusele on keeletehnoloogias viimastel aastatel väga kiiresti arenenud, selle raames on kujunenud täiesti uued suhted keeletehnoloogia ja teoreetilise keeleteaduse vahel. On tekkinud vajadus neist arengusuundadest ülevaade saada ja koostada programm nende rakendamiseks eesti keele arvutitöötluses. Teiseks eesmärgiks on arendada konkreetseid uurimis- ja arendustöid valdkondades, mis on ette teada olevalt tähenduspõhise lähenemise aluseks: 1, semantiline kirjeldussüsteem (metakeel) - semantilised kategooriad (ontoloogia), nende seosed; 2. semantika ja süntaksi seosed (süntaktiliste konstruktsioonide semantika); 3. sõnaliikide semantika; 4. semantiline ühestamine (olemasoleva programmi täiustamine, alternatiivsete programmide katsetamine). Need tööd eeldavad järgmiste olemasolevate keeleressursside olulist edasiarendamist: 1) semantiline andmebaas (tesaurus, wordnet) - täiendatud vähemalt 30 000 üksuseni, 2) semantiliselt ühestatud tekstikorpus (ühestatud nii nimi-, tegu-, kui ka omadussõnad) - täiendatud 100000 üksuseni. |
projektiga seotud isikud | ||||
---|---|---|---|---|
nr | nimi | asutus | amet | |
1. | Neeme Kahusk | Tartu Ülikool | teadur | |
2. | Kaarel Kaljurand | Tartu Ülikool | doktorant | |
3. | Heili Orav | Tartu Ülikool | teadur | |
4. | Kadri Vider | Tartu Ülikool | teadur | |
5. | Haldur Õim | TÜ Filosoofiateaduskond | professor |