teema: | Mitmemõõtmeliste andmelünkade hindamine lisateabe abil |
---|---|
tunnusnumber: | ETF5521 |
projekti tüüp: | Eesti Teadusfondi grant |
erialad: |
1.1-1.5. Täppisteadused 5. Sotsiaalteadused |
seisund: | lõppenud |
asutus: | TÜ Matemaatika-informaatikateaduskond |
projekti juht: | Ene-Margit Tiit |
kestus: | 01.01.2003 - 31.12.2005 |
kirjeldus: | Andmestiku lünklikkus on viimase kümnendi jooksul muutunud esmatähtsaks probleemiks rakendus-statistika paljudes valdkondades, sh eriti sotsiaalteadustes. Probleemi keerukuse ja mitmetahulisuse tõttu rakendatakse selle valdkonna uuringutes kaasaegse matemaatilise statistika tipptulemusi (näiteks Bayesi lähenemisele tuginevat Monte Carlo Markovi ahelate teooriat). Siiski ootab rida ülesandeid, sh eriti ajast sõltuvate (nn paneel- või kordusmõõtmiste) ja eriti kõrgedimensionaalsete andmestike puhul uusi ideid ja veenvaid lahendusi. Käesoleva grandiprojekti raames kavandatakse teha järgmisi samme: 1. Analüüsida viimasel ajal välja töötatud andmelünkade prognoosimise meetodite (EM, MCMC, hot deck, jm) teoreetilisi aluseid, sh nende robustsust eritüüpi andmejaotuste ja lünkade tekkemehhanismide korral. 2. Testida olemasolevate meetodite rakendatavust ja tulemuslikkust eritüüpi (algoritmiliselt mooduststud/ genereeritud) testandmestike abil. 3. Analüüsida võrdlevalt erinevate meetodite rakendamise tulemusi mitmesuguste reaalsete andmestike puhul. 4. Modifitseerida standardseid meetodeid, kasutades mitmemõõtmeliste ekstremaaljaotuste omadusi, mis võimaldavad ette määrata prognoositavate puuduvate värtuste võimalikke ja tõenäoseid väärtuspiirkondi (nn tundlikkuse analüüs, mida seni on tehtud vaid binaarsete tunnuste jaoks) 5. Leida eritüüpi andmestike (sh korduv mõõtmiste käigus laekunud andmed ja kõrgdimensionaalsed läbilõikelised sotsaillauuringute andmed) andmejaotusest, lünkade hulgast ja iseloomust sõltuvad jaoks optimaalsed andmelünkade käsitlusmeetodid ja hinnata saadava tulemuse adekvaatsust. |
projektiga seotud isikud | ||||
---|---|---|---|---|
nr | nimi | asutus | amet | |
1. | Ene Käärik | TÜ, Mat Stat Inst | doktorant | |
2. | Ene-Margit Tiit | TÜ Matemaatika-informaatikateaduskond | emeriitprofessor | |
3. | Mare Vähi | TÜ, Mat Stat Inst | lektor |