kolmapäev, juuli 13, 2011

Professor Ene-Margit Tiit: Kas Andrus Veerpalu dopinguproovi mõõtmistulemused on usaldusväärsed?

Priit Pullerits: Nagu veteranlugejad teavad, on sellest blogist saanud ajas kõige kiiremat ning samuti vettpidavat teavet Eesti suusatamise viimaste kuude skandaalide kohta, olgu selleks Andrus Veerpalu positiivne dopinguproov või Otepää MK-etapi korraldamisega seonduv (milles avalöögi tegi küll Eesti Päevaleht, aga loovutas seejärel initsiatiivi mulle). Siin on visadele lugejaile uus tükk väga asjalikku ja tarka teavet Veerpalu juhtumi kohta, mida ei ole mitte keegi mitte kusagil veel avaldanud, aga mis õnnestus mul oma kanaleid pidi hankida Ene-Margit Tiidult, Tartu Ülikooli matemaatilise statistika emeriitprofessorilt. Järgnev on professor Tiidu koostatud ekspertarvamus neile teadlastele, kes panid kokku Veerpalu kaitsematerjalid.
***
Veerpalu dopinguanalüüsi puhul on tehtud kaks mõõtmist – A- ja B- proov, mis põhimõtteliselt peaksid mõlemad mõõtma täpselt sama näitajat, seetõttu saab siin rakendada statistilist lähenemist.

Tegelikult näitas B-proovi tulemus otsekohe, et teise näitaja, Kit2 mõõtmistulemused ei ole usaldusväärsed ja kuigi need mõlemad on referentstasemest kõrgemad, erinevad nad üksteisest nii palju, et nende põhjal ei saa järeldada, et mõõdetav suurus (Kit2 tase organismis) on referentstasemest kõrgem.

Kahe mõõtmistulemuse korral on kõige tõenäolisem hinnang mõõdetava tulemuse õigele väärtusele nende mõõtmistulemuste aritmeetiline keskmine. Mõõtmise täpsust iseloomustab nende mõõtude standardhälve. Standardhälbe kaudu leitakse usalduspiirkond.

Usalduspiirkond tähendab seda, et mõõdetava suuruse õige väärtus asub 95-protsendilise tõenäosusega selles usalduspiirkonnas, kusjuures pole selge, kus täpselt. Küll aga on väga vähe tõenäoline, et õige väärtus asuks väljaspool usalduspiirkonda.

Siit tuleneb eeskiri järelduse tegemiseks statistiliste mõõtmiste põhjal. Selleks, et väita, et mõõdetava suuruse (näiteks Kit2) tegelik väärtus on suurem kui referentsväärtus, peab see referentsväärtus olema väiksem mõõdetava suuruse ümber ehitatud usalduspiirkonnast, st tema alumisest piirist (vt joonis). Kui see nii ei ole, siis pole alust väitel, et mõõdetav tegelik väärtus on referentsväärtusest suurem, kusjuures saab ka seda näidata, kui suure tõenäosusega niisugune väide on ekslik.

Teeme rehkenduse hGH teise komponendi Kit2 arvudega. Need on 2 ja 3,08, keskmine on 2,54 ja standardhälve on 0,764. Tavaviisil usalduspiire arvutades saaksime alumise piiri väärtuseks 2,54-2X0,76=1,02 ja ülemise usalduspiirkonna väärtuseks 4,07. Selles vahemikus võib mõõtmistulemuste põhjal olla proovi Kit2 tegelik väärtus. Usalduspiirkond on väga lai, sest vaatlused on teineteisest väga erinevad. Aga kuna alumine usalduspiir ei ole referentstasemest piirnormist 1,68 suurem, siis ei saa korrektselt väita, et mõõdetav suurus, antud juhul Kit2 tegelik väärtus, oleks piirnormist suurem.

Saame esitada ka täpsema tulemuse. Kui kasutada t-jaotust ühe vabadusastmega, siis võime öelda, et niisuguseid mõõtmistulemusi on võimalik saada tõenäosusega 0,23 ka sel juhul, kui mõõdetav suurus (s.o näitaja Kit2 tegelik väärtus) on väiksem kui 1,68, kuid mõõtmise täpsus on nii madal, nagu käesoleval juhul. Seega kinnitades, et proov oli lubatud tasemest kõrgem, on eksliku väite tõenäosus 0,23. Põhjuseks on see, et sama suuruse kahekordsel mõõtmisel saadud näidud on liiga erinevad. Sellest, et mõlemad näidud on üle referentstaseme, ei piisa veel tõestamaks, et mõõdetav suurus on referentstasemest suurem – selleks on tarvis ka seda, et mõõtmistulemused oleksid stabiilsed ja omavahel kooskõlas. Praegu nad seda ei ole.

(Kuna joonise transportimine siia blogisse ei õnnestunud, siis kirjeldan seda järgnevas lõigus professor Tiidu seletuste abil - P.P.)

Kujutage ette madalat ja pikka ristkülikut - see on Kit2 näidu põhjal konstrueeritud usalduspiirkond. Ristküliku kummagi otsa lähistel on kaks valget ringi, mis kujutavad proove väärtustega 2,0 ja 3,08. Ristküliku keskel on sinine ring, mis on proovide keskmine (2,54) ja mida on kasutatud usalduspiirkonna konstrueerimiseks. Usalduspiirkonna otspunktid on 1,02 ja 4,07. Ristküliku vasaku otsa lähistel on punane nooleke, mis tähistab kriitilist piiri (1,68). See piir asub usalduspiirkonna sees. See tähendab, et analüüsi Kit2 tegelik väärtus (mida mõõdab kaks väga erinevat tulemust) võib olla ka kriitilisest piirist väiksem.

Loogika on selles, et kui mingi suuruse mõõtmisviga on väga suur (nagu see praegusel juhul on – me ei tea, kas põhjuseks oli mõõteriist või metoodika), siis on alati arvestatava tõenäosusega ka võimalus, et tegelik väärtus, mida mõõdetakse, on mõnevõrra väiksem kui väikseim mõõtmistulemus. Praegu on võimalik seda tõenäosust t-jaotuse abil ka hinnata – tõenäosusega 0,2 on analüüsitava näidu tegelik väärtus väiksem kui kriitiline piir.
***
Eilses telefonivestluses lausus professor Tiit mulle, et ta ei ole kindel, kui palju need, kes Veerpalu kaitsematerjale kokku panid, tema statistilist seletust arvestasid ja kui palju nad sellest üldse aru suutsid saada. Ta lisas, et matemaatilise statistika valdamine jätab tema hinnangul Eesti teadlaskonnas teinekord palju soovida.
******Saguaro National Park, Rincon Mountain District, Arizona. 2. aprill 2011. Pildistanud Priit Pullerits. (Suuremalt vaatamiseks klikkida pildile.)

Foto 1: Andrus Veerpalu (paremal) lahkumas 11. juunil Aivar Pilve advokaadibüroost koos vandeadvokaat Ilmar-Erik Aavakiviga (ees), Tartu Ülikooli professori Sulev Kõksi ja füsioloogiadoktori Anton Terasmaaga. Foto autor: Peeter Langovits, Postimees/Scanpix
Foto 2: Ene-Margit Tiit, Tartu Ülikooli matemaatilise statistika emeriitprofessor. Foto autor: Arno Saar, Õhtuleht/Scanpix
Foto 3: Andrus Veerpalu kaitsemeeskond (vasakult) vandeadvokaat Aivar Pilv, füsioloogiadoktor Anton Terasmaa, Tartu Ülikooli professor Sulev Kõks ja vandeadvokaat Ilmar-Erik Aavakivi. Foto autor: Peeter Langovits, Postimees/Scanpix

55 Kommentaarid:

At 10:34, Anonymous Anonüümne said...

Samamoodi võiks ka väita, et kui Pulleritsu IQ mõõdeti kaks korda ja saadi 100 ning 151, siis on oluline tõenäoseus (tervelt 23%!), et Priidu tegelik IQ on madalam kui 84. Seega nagu oleksime tõestanud, et Priit on loll! (LOL!) -- See arutlus põhineb eeldusel, et mõõtmistulemust mõjutab lõpmatu arv väga väikeseid häirivaid tegureid, mis koosmõjus tingivad mõõtmistulemuste kõrvalekaldumise nn Bell'i kõvera ehk normaaljaotuse kohaselt. Võtke see eeldus ära ja kogu kontruktsioon kukub kokku.

Siin

 
At 10:40, Anonymous Anonüümne said...

Priit lubas eile (sõna-sõnalt) Andrus Veerpalu kaitseks esitatud teadlaste töid. Täna on jutuke, mille kohta pole teada (sõna-sõnalt) kui palju need, kes Veerpalu kaitsematerjale kokku panid, tema statistilist seletust arvestasid.

 
At 10:44, Anonymous Anonüümne said...

Oleks huvitav teada, mida Priit ise sellest arvab?

 
At 10:46, Anonymous Anonüümne said...

Oled rajalt eksinud. Statistika on kõikvõimas, aga tehnilisele veale on parem tugineda. Uuri oma kopenhaagenitelt, millise eksimuse tegi proovi võtja protokolli täites.

 
At 10:50, Anonymous Anonüümne said...

See jutt peab paikka vaid siis kui on kindlus, et mõõdetav eksemplaar ei muutu.
Mõõtes mõõdulindiga näiteks vee taset vihmaveetünnis ja saades ühel päeval x ja siis mõõtes järgmisel päeval y, vahepael vesi aurustusb või siis sajab vett juurde. Ning siis tulemuste erinevuse tõttu kuulutada mõõdulindi ebausaldusväärseks - jeerait.


Kui kiirelt pidigi proov laborisse jõudma, et seda analüüsida saaks?

P

 
At 10:51, Anonymous Anonüümne said...

Elementaarne. Sellele hälbele vihjati kaitsjate poolt kohe AV juhtumi alguses. Juhul kui FIS seda seletust aluseks ei võta, siis paneb see põntsu kogu tehnokraatliku ühiskonna alustugedele. Standardhälbel põhineb kogu meie elu, olenemata sellest, kas me oskame seda arvutada või ei. See lähtepunkt on rock solid.

 
At 11:02, Anonymous Anonüümne said...

Statistiliselt esineb tõenäosus, et mingi marker Veerpalu proovis jäi alla piirnormi, saan ma õigesti aru? Aga reeglid on reeglid, normid on kirjas ja Veerpalu tulistas need näitajad kahel korral pihuks ja põrmuks laia kaarega. Mida see statistika peaks tõestama? Igatahes mitte seda, et Veerpalu proov oli A ja B mõõtmisel negatiivne ning et Veerpalu polnud mingit kasuvuhormooni uneski näinud. Nii et taas üks teaduslik gibberish.

10:46 - millise vea siis? See on mul kahe silma vahele jäänud, et milles seisnes viga kõik need aastad jahitud ja elu kõige tähtsama proovi võtmisel ja protokollimisel? Kui tead, siis oleks kena kui kirja paneksid, kasuta kasvõi sõnu 'väidetavalt' jne.

 
At 11:03, Anonymous Anonüümne said...

Emeriitprofessor Tiit väidab sisuliselt, et statistiliselt kindlalt midagi öelda ei saa. Ei imesta sellise tulemuse üle.
Muide, kui suur oli tõenäosus, et Kärbi ja Einaste verenäidujuhtum asi oli täiesti juhuslik kokkusattumine? Võrreldes teooriaga, et eesti koondises oli ikka väike sebimine ja sama tarneahela otsas oli ka vahelejäänud venelane Võlegzhanin.

 
At 11:20, Anonymous Anonüümne said...

"Standardhälbel põhineb kogu meie elu"

Standardhälbel põhineb tubli tükk matemaatikat - mida ka ülikoolis tugengitele pähe taotakse. Õigusemõistmine seni veel ei põhine matemaatikal. (Väidan, et see on hea). Kohtuotsuseid teevad (veel) inimesed, mitte arvutusmasinad. Standardhälve on matemaatika mainstream, kuid mitte ka kogu matemaatika. Ja ärgem unustagem, matemaatika ei võrdu reaalse eluga. On ka teisi matemaatika harusid nagu mittelineaarsete protsesside, fraktaalide teooria jne. Kohus vaatab asjaolusid nende kogumis. Matemaatika seda ei suuda, jäädes opereerima mudelitega, mis alati on tegelikkuse lihtsustused..

 
At 11:50, Anonymous Anonüümne said...

11:02 esitab väga huvitava vaatenurga: milles seisnes viga kõik need aastad jahitud ja elu kõige tähtsama proovi võtmisel ja protokollimisel?

kas sellest võib järeldada, et SA Eesti Antidoping jahtis aastaid spetsiaalselt Andrust? kes sellise tööülesande on püstitanud?

 
At 12:12, Anonymous Anonüümne said...

Tõenäosus tegeliku väärtuse asumiseks allpool referentsväärtust on 0,2 ehk siis sisuliselt 20% juhtumitest annab meetod ebakorrektse tulemuse. Võimalik ka vastupidine - A ja B proov negatiivsed, aga usalduspiirkond ületab m.h. referentsväärtust. Iseasi on see, et need, kes vahele ei jäänud tavaliselt ei kurda.

Kui pikk oli ajavahe A ja B proovide võtmisel? Kas see ajavahe oli piisavalt lühike selleks, et saaksime eeldada, et mõõdeti sama suurust? Ma usun, et oli, vastasel juhul pole A ja B proovikontseptsioonil mõtet.

Mis puutub 11:02 väitesse, siis pane tähele, et statistiku seisukoht on, et tõenäosusega 0,2 ei tulistanud näitajaid pihuks ja põrmuks mitte Veerpalu vaid vigane mõõteriist (seda siis tehnoloogia, protseduuri või aluseks oleva teooria mõttes).

Me oleme praeguseks näinud, kuidas taotlus A proovide tulemusi salajas hoida neile keda kaitsta püütakse - sportlastele - tegelikult halba teeb.

Me oleme praeguseks näinud, kuidas süsteem ei ole valmis mõõtmisvahendi kvaliteeti hindama.

Mis põhjusel ei võiks kõigi dopinguproovide tulemused olla avalikud? Võtame A proovi ja B proovi. Nüüd on kolm võimalust:

a) Mõlemad proovid, koos usalduspiirkonnaga on allpool referentsväärtust => sportlane puhas, info avalik

b) Mõlemad proovid, koos usalduspiirkonnaga on ülevalpool referentsväärtust => sportlane patune, info avalik

c) Proovide põhjal ei ole võimalik usaldusväärselt väita, kas oli või ei olnud => sportlane puhas, info avalik

(c) juhtumi korral analüüsivad WADA ja sportlase meeskond koostöös tekkinud olukorda - on võimalik, et WADA eksis, aga sportlane jääb puhtaks kuni reaalselt positiivse proovi andmiseni.

 
At 12:15, Anonymous Anonüümne said...

Täpsustan oma 12:12 kirjutist. Usalduspiirkond ei ole mitte mõõdiku globaalne karakteristik vaid seotud ikkagi konkreetsete A ja B proovidega. Erinevate proovikomplektide korral on veapiirkonnad kindlasti erinevad. Samas tasuks uurida, et mis see statistiline viga üle kõigi A ja B proovide on.

 
At 12:21, Anonymous Anonüümne said...

to 12:12
kui oleks totaalne avalikustamine siis poleks pulleritsudel ja muulidel võimalik tolmu üles keerutada. ärgem võtkem meie arvamusliidritelt leiba laualt.

 
At 12:25, Anonymous Anonüümne said...

"kas sellest võib järeldada, et SA Eesti Antidoping jahtis aastaid spetsiaalselt Andrust?"

Kas Teie arvate, et kui nt jutud laialt linna peal liiguvad, et teatud advokaat vahendab kohtunikele altkäemaksusid, siis KAPO ei peaks neid jutte kontrollima?

"kes sellise tööülesande on püstitanud?"

Sihtasutuse juhtkond, kooskõlas SA põhimäärusega ja rahvusvahelise dopinguvastase konventsiooniga, millega Eesti on ühinenud, ning koostöös FISi ning WADAga?

 
At 12:31, Anonymous Anonüümne said...

Tore, et SA Eesti Antidoping töötaja on meiega liitunud.

Palun, kas Te oskate öelda, millistes tingimustes (kui kõrgel üle merepinna) asus Andrus Veerpalu proovi andmise ajal?

 
At 12:44, Anonymous Anonüümne said...

Kõrguse mõjust kasvuhormoonitesti usaldusväärsusele ei ole teaduslikke tõendeid. Ja kui olekski, siis Eestis ei ole teadupärast mägesid.

 
At 12:45, Anonymous white said...

Tere Priit!

Kas neid arve 3,08 ja 2,0 on meedias üldse kajastatud varem, et mis arvud need on?

Mina teadsin kogu aeg, et Veerpalult võetud A-proovis olid näidud 2,63 ja 2,75, B-proovis aga 2,73 ja 2,0. Kusjuures kasvuhormooni sisalduse piirnormid on vastavalt reeglitele 1,81 ja 1,68.

 
At 13:01, Anonymous Anonüümne said...

Arvestades kuidas info kohalikelt proovi võtjatelt lekkis, siis ei sa midagi välistada. Ja kummaline, et kõigile teada lekitaja on rõõmsalt oma ametis edasi, nagu usaldusväärsed kodanik.
Vanajumal on aeglane aga õiglane, ei pääse ka nemad.

 
At 13:08, Blogger Michael E.P said...

Küsiks ka, et kust pärinevad numbrid 3.08 ja 2.0 - kui allikas pole teada, ei ole ka antud statistiline arutlus ju usaldusväärne

 
At 14:27, Anonymous Anonüümne said...

Kui lähemat huvi on, siis WADA kasvuhormooni mõõtmise juhendis on kogu protseduur kirjas. Viit: http://www.wada-ama.org/Documents/Resources/Guidelines/WADA_Guidelines_hGH%20Differential%20Immunoassays_EN_June10.pdf

 
At 14:28, Anonymous Anonüümne said...

Emeriitprofessor Tiit hindab standardhälvet kahe vaatluse põhjal. Julgen sellise hinnangu stabiilsuses sügavalt kahelda. 2-elemendiline valim on statistiliste järelduste tegemiseks liiga väike ja seega ei ole siin ka mõtet leida usaldusintervalli.

Samuti tundub, et emeriitprofessor Tiit hindab aritmeetilise keskmise usaldusintervalli asemel vaatluste prognoosiintervalli. Usaldusintervalli leidmiseks peaks kasutama aritmeetilise keskmise standardhälvet ehk vaatluste standardhälbe jagama ruutjuurega 2-st.

Tauno Metsalu, MSc (matemaatiline statistika)

 
At 14:38, Anonymous Anonüümne said...

Oma kanalite kaudu info hankimine on tore - aga: Kas prof Tiit võib öeldut ka vande all kinnitada? Ja veel olulisem: aga kas see on kogu tõde? Ma ei sea lugupeetud teadlase usaldusväärsust loomulikult kahtluse alla. Kuid vägagi tõenäoline on, et kõrge renomeega teadlase arvamus nööritõmbajate poole Pulleritsule ette söödetud. Sellele viitavad ka viimastes kommentaarides kõlavad küsimused? Järjekordne manipulatsioon? Vastuseid saaks anda ainult UURIMINE, ja mitte ajakirjanduslik, vaid õiguskaitseorganite poolt toimetatav. Ajakirjandus ei saa teatud piiridest kaugemale minna. Soomes on sellist uurimist tehtud, Eestis mitte.

 
At 15:03, Blogger Priit Pullerits said...

Olles vaadanud selle teema kohta veebimeedias tehtud kommentaare, sest seda uudist on palju tsiteeritud, siis on hea meel nentida, et siinsed kommentaatorid on hoidnud raudselt kõige asjatundlikumat, sisukamat, tsiviliseeritumat joont. Aitäh kõigile! Sellise õhkkonna ja arutelu ning sissekande lausa teadusliku kriitika (Tauno Metsalu!) üle võib ainult uhkust tunda - ja seda võivad teised meediaüksused vaid kadestada. Hoidkem taset!

Viimasele, 14:38, ütlen vaid nii palju, et ma ei taha oma kanaleid paljastada, kuidas ma selle ekspertarvamuseni jõudsin, kuid see tuli mulle esiti täiesti juhuslikult ja seejärel juba minu initsiatiivist tulenevalt. Sel inimesel, kelle käest prof Tiidu töö kohta kuulsin, pole küll spordi ega ammugi mitte suusatamisega mingit seost. Jah, alati maksab kahelda, aga paranoiliseks ei maksa ka minna, et kõiges üksnes ja ainult kellegi manipulatsiooni näha.

 
At 15:05, Anonymous Anonüümne said...

14:28, tänan! Matemaatikat tundmata on väga keeruline hinnata, mis tasemel juttu Ene-Margit Tiit ajab. Mul on teile veel üks küsimus - kas Ene-Margit Tiidu jutt näeb asjatundjale välja pigem nagu abitu katse matemaatika-terminitega lollitada tavainimesi, kellel matemaatikast aimugi pole? Ja mis te arvate, kui kallilt kinnimakstud advokaadid tõesti selle materjali toimikusse köitsid, siis kas eestlased ei paista selle tagajärjel idiootidena (lisaks sellele, et nad kirglikult dopingutarvitamist kaitsevad)?

Tänan vastuse eest ette!

 
At 15:13, Blogger Priit Pullerits said...

Ja nii palju veel huvitavat statistikat, et siinne blogisissekanne, millest PM online avaldas lühiuudise, oli täna kella 15 seisuga PM online'is päeva loetavuselt teine uudis. Mis teeb muidugi heameelt, et siit blogist leiate päevakajaliste teemade olulisi arendusi. Aitäh lugemast!

 
At 16:48, Anonymous Anonüümne said...

Toon ehk elulisema näite.
Kaks politseinikut mõõtsid kahe radariga (sama liiki) teie auto kiirust asulas. Ühel aparaadil oli näit 90, teisel 60.
Kas te jääksite nõusse, et ületasite lubatud kiirust (50)?
Mina saadaks nad küll sellise tehnikaga "kukele". Arvutused näitavad, et tegelik kiirus on vahemikus 33 ..... 117!

 
At 17:02, Anonymous Anonüümne said...

BTW,seda "suurt uudist" Tiidu sulest sai avalikult lugeda juba 3 kuud tagasi ...

Lihtsalt (ja eluliselt) Tiidu jutt lahtiseletatud: liikluspolitsei ei tohiks sind karistada 1%-lise kiirusületuse eest kasutades +-7%-se täpsusega mõõtevahendit.

 
At 17:06, Anonymous Anonüümne said...

Tundus kuidagi juba kuskil loetud jutt. Veidi internetis otsimist ja leidsin Päevalehe artikli 27. aprillist 2011: http://www.epl.ee/artikkel/596929

 
At 17:10, Anonymous Anonüümne said...

Mis siin targutada-kui täiesti süütu mees on tänu "testile" süüdi mõistetud siis midagi peab WADA kuningriigis mäda olema :)

 
At 17:31, Blogger Michael E.P said...

Pole küll ise statistikas kõige suurem teadlane, aga juhiksin tähelepanu teatud asjale. Nimelt dopingu kasutamise üle saab otsustada siis, kui see ületab WADA poolt määratud läviväärtuse. Näiteks ei tohi kuulus astmaatikute rohi salbutamool ületada organismis taset 1.0mikrogrammi/milliliitris. Antud aine määramise standardne määramatus on 0.1 ja 95% usaldusintervall 2*0.1. Seega on WADA seadnud otsustuspiiriks läviväärtus T+2*Uc=1.2. Ehk kui sportlane annab vereproovi tulemusega 1.1 on ta puhas, üle 1.2 on aga patustaja (95% kindlusega). Ilmselt arvas statistikaprofessor, et ka kasvuhormoon põhineb sarnasel meetodil.

Tegelikkuses on hGH taseme määramine veidi erandlik. Nimelt on recGH/pitGH füsioloogilised väärtused saadud uurides sportlaste verd, täpselt selle sama meetodiga, millega dopingutarvitajat tuvastatakse. Piisavalt suure kohordi korral on saadud teatud referentsväärtus. Sellest referentsväärtusest on omakorda määratud otsustuspiir (DL), arvestades testi standardse määramatusega. Seega ei ole vaja tulemust analüüsides veel uuesti hakata arvestama standardse määramatusega, kuna see on arvestatud juba DL määramise protsessis.

 
At 17:37, Anonymous Anonüümne said...

Mõlemad Tauno Metsalu märkused on õiged.

Tegin ka huvi pärast mõned arvutused, võttes normaaljaotuse täiendkvantiili asemele t-jaotuse (vabadusastmete arvuga 1) täiendkvantiili.

* Andmed 2 ja 3.08. 95% usalduspiir [-4,32; 9,40]. Tõenäosus, et parameetri väärtus jääb alla 1,68, on 18%.

* Andmed 2,63 ja 2,75 (A- ja B-proovi esimesed väärtused, nagu nimetab 12:45). 95% usalduspiir [2,04; 3,32]. Tõenäosus, et parameetri väärtus jääb alla 1,81, on alla 2%.

* Andmed 2,75 ja 2 (A- ja B-proovi teised väärtused). 95% usalduspiir [-2,39; 7.14]. Tõenäosus, et parameetri väärtus jääb alla 1,68, on 16%.

Samas pean ütlema, et nii emeriitprofessor Tiidu kui ka minu arvutused põhinevad eeldusel, et uuritav suurus on normaaljaotusega. Tegelikkuses peab see paika ilmselt ainult väikeses piirkonnas, sest minu teada ei saa nende mõõdetavate tasemete väärtused olla näiteks negatiivsed. Laias piirkonnas tuleks seetõttu normaaljaotuse asemel kasutada mingit muud jaotust, näiteks (ebasümmeetrilist) binoomjaotust. Eriti ebatäpsed on usalduspiirid, sest need ulatuvad keskväärtusest kaugemale, protsendid peaksid olema natuke täpsemad.

15:05 - Ma pole küll Tauno Metsalu, aga tavainimeste lollitamisena E.-M. Tiidu jutt küll ei paista. Emeriitprofessor Tiit ei väida, et Veerpalu näitaja jääb lubatud piiridesse ega sealt välja, vaid väidab, et selliste-ja-selliste meetoditega saame sellised-ja-sellised tulemused; interpreteerige neid nüüd ise nii, nagu tahate. Kasutatud meetodid on lihtsad tavalised statistilise andmetöötluse meetodid.

 
At 17:51, Anonymous Anonüümne said...

17:31 - on ikka vaja arvestada standardse määramatusega. Otsustuspiir arvestab varieeruvust inimeste vahel, aga testitulemuste standardhälve kirjeldab varieeruvust mõõtmistulemuste vahel ühe inimese puhul.

Testidega on teada saadud selle näitaja keskväärtus ja standardhälve (dispersioon) üldkogumis. Mis meetodit seejuures kasutati, pole oluline. Nüüd on vaja leida, mis on selle näitaja väärtus ühel konkreetsel inimesel. Tehakse mitu testi, leitakse usaldusintervall. Kui see jääb tervikuna otsustuspiirist allapoole, siis võib teatava piisavalt suure tõenäosusega ütelda, et näitaja väärtus selle inimese puhul jääb üldkogumi loomuliku varieeruvuse piiridesse.

 
At 18:02, Blogger Michael E.P said...

oleks abi kui mõni statistik selle ära seletaks:

According to WADA’s TD2010DL (Technical Document on Decision Limits for
the Confirmatory Quantification of Threshold Substances)6, the decision rule
applicable to assays for which the threshold value(s) have been established based on
reference population statistics does not consider the inclusion of a guard band for the
determination of a DL. In such cases, such a guard band that reflects the uncertainty
of the measurements provided by the assay(s) would have already been incorporated
in the definition of the threshold(s). Therefore, the zone of analytical values
considered compliant (negative) or not (AAF) with this decision rule would be defined
by the threshold value itself, which constitutes the DL.

The DL values specified above have been derived from the analysis of Samples
from Athletes treated under real Doping Control conditions of Sample collection,
transportation, storage and analysis (using the current commercial ISO-certified hGH
kits and standardized analytical protocols and instrumentation). The established DL
values define a combined test specificity (between the two kits) of 99.99%. These DL
values are conservative values and will be periodically refined as more data is
accumulated from Doping Control tests performed by WADA-accredited Laboratories.

 
At 18:57, Anonymous Anonüümne said...

18:02 - mina saan sellest tekstist aru nii, et testi mõõtmisviga on otsustuspiiri juba sisse arvestatud (st minu oletus 17:51 ei pea paika). See tähendab, kui testimisel saadud väärtus jääb otsustuspiirist ülespoole, siis on tegemist dopingujuhtumiga (AAF), isegi testi mõõtmisviga arvesse võttes.

See tähendab, et E.-M. Tiidu moodi usalduspiiride arvutamine Veerpalu süütuse tõestamiseks ei aita, sest need on juba testi läveväärtusesse sisse arvestatud. Aitaks näiteks rõhumine sellele, et kahe testi tulemused olid teineteisest niivõrd erinevad, mistõttu test võib olla mitte-usaldusväärne.

Teine lõik ütleb, et nendel, kes pole dopingut tarvitanud, annab test tulemuse "negatiivne" 99,99% juhtudest (test specificity). See tähendab, et nendel, kes pole dopingut tarvitanud, annab test tulemuse "positiivne" (väärpositiivne) 0,01% juhtudest. Siit aga ei saa teha mingit loogilist järeldust, kas see, kelle puhul test annab tulemuse "positiivne" on tegelikult dopingut tarvitanud või mitte, sest puuduvad arvulised andmed, milliseid tulemusi annab test nendel, kes on dopingut tarvitanud. Näiteks teoreetiliselt võib juhtuda, et kõigil nendel, kes on dopingut tarvitanud, annab test tulemuse "negatiivne".

 
At 19:05, Blogger Michael E.P said...

nii sain ka mina aru. Samas ei suuda ma leida, kuidas on antud otsustuspiirideni jõutud ning kui palju on nad kõrgemad grupi referentsväärtusest

 
At 19:26, Anonymous Anonüümne said...

19:05 - Ma kujutan ette, et test on standardiseeritud nii palju kui võimalik. See tähendab, testitulemuste standardhälve, isegi kui testi viivad läbi erinevad inimesed, on üsna konstantne. Kui saaks umbes teada üldkogumi varieeruvuse (standardhälbe) ja testitulemuste varieeruvuse (standardhälbe), siis saaks vajalikud asjad nende põhjal välja arvutada.

 
At 20:02, Blogger Michael E.P said...

Veerpalu A-proovi standardhälbed olid igatahes 0.22 (kit1) ja 0.24 (kit2) mu arust!

 
At 21:20, Anonymous Anonüümne said...

20:02 - Nendest andmetest saab teha huvitavaid järeldusi.

Ma eeldan, et dopinguproovi analüüsimine laboris toimub nii, et mõõdetakse sama näitajat mitu korda ning arvutatakse tulemuste keskmine ja standardhälve. Seetõttu oletan, et A-proovi kit1 tulemused on normaaljaotusega parameetritega 2,63 ja 0,22 ning A-proovi kit2 tulemused normaaljaotusega parameetritega 2,75 ja 0,24. Nüüd aga võib esitada küsimuse: kui B-proovi tulemused on samade normaaljaotustega mis A-proovi tulemused, siis millise tõenäosusega said seal tulla väärtused 2,73 ja 2,0?

Normaaljaotuse tihedusfunktsiooni abil saame:

* tõenäosus, et B-proovis annab kit1 tulemuse 2,73 või suurema, on 32%;

* tõenäosus, et B-proovis annab kit2 tulemuse 2,0 või väiksema, on 0,09%.

Näeme, et B-proovis on kit2 tulemus A-prooviga võrreldes äärmiselt ebatõenäoline. Et A- ja B-proov võeti samal ajal, siis jääb mulje, et edasiste etappide - proovide käitlemise või analüüsimise juures on midagi olnud valesti.

 
At 21:46, Blogger Michael E.P said...

Kontrollisin üle, SD-d siiski vastupidi 0.24 ja 0.22 - usun, et see ei ole siiski suur vahe. Samas on see GH test ikkagi pisut erandlik, nimelt antakse minuteada nii A kui B proovi jaoks eraldi SD - samas jällegi ei saa nüüd aru, kas seda üldse tarviski on. Siin üks lõik WADA dokumentidest:


As stated in Note 2, the assay MU is not applied for compliance decisions
(declaration or not of an AAF) since the estimate of the MU has already been
incorporated into the values of the DL. The inclusion of the uc (standard uncertainty) in the test report is in compliance with the TD2010DL6 and serves to demonstrate that the Laboratory has
performed the assay(s) in accordance with the technical specifications established in
these Guidelines. According to TD2010DL6, the value of uc reported by the Laboratory
must be not greater than the maximum acceptable values of uc Max established from
inter-Laboratory
EQAS studies (see section 7 below).

 
At 21:48, Blogger Michael E.P said...

Lisaks veel, et A ja B proov ei ole sõna otseses tähenduses identsed, kuna üks analüüsitakse koheselt, teine aga säilitatakse ja analüüsitakse hiljem - seega ei saa me eeldada, et tegemist on kahe identse mõõte objektiga ning seljuhul vist on statistika rakendamine raskendatud!

 
At 22:06, Anonymous Anonüümne said...

21:46 - Esimene tõenäosus on sel juhul 34%, teine 0,03%.

21:48 - A- ja B-proov võivad tõesti olla mitteidentsed, aga nendevaheline erinevus ei tohiks olla väga suur, sest otsustuspiir on mõlema puhul sama. Vist on väga haruldane, et A- ja B-proov annavad tegelikult erineva tulemuse (positiivne/negatiivne). Kui nüüd ka B-proovi standardhälbed on A-prooviga samad, siis sellest piisab: normaaljaotusel on kaks parameetrit, keskväärtus ja standardhälve, ning kui need on samad, siis ka normaaljaotused on samad.

 
At 22:18, Blogger Michael E.P said...

Lugesin veel ka läbi ajakirjas Clinical Chemistry ilmunud antud meetodi kirjeldused. Autorid testisid seal samamoodi proove ka 28 päeva jne möödumisel ning leidsid, et natuke võivad pitGH ja recGH kogused langeda, samas nende suhe võib natukene tõusta, kuid mõlemal juhul jäid väärtused väiksemaks statistilisest olulisusest (P suurem kui 0.05). Seega ei saa seda varieeruvust kanda proovide säilitamise kaela, mis oli minu enda hüpotees

 
At 10:18, Blogger Priit Pullerits said...

Väga huvitav, härrased, äärmiselt põnev ja sisukas arutelu teilt eilse päeva õhtupoolikul, lausa nauding seda jälgida. Suur aitäh teile - näitasite stammkommentaatoreile, milline on ühe õige kommenteerija tase - õige kommenteerija suudab oma asjatundlikkusega püstitatud teemat kriitiliselt edasi analüüsida, mitte ei ilgu ega nori tüli, nagu paljud seda teevad. Tänu teile võib öelda, et siin blogis on selle teema käsitlus raudselt Eesti parim! Olge te tuhandest tänatud.

 
At 10:40, Anonymous Anonüümne said...

Sedasama, mida Michael E.P väga õigesti ütles, võis eeldada ka ilma WADA reegleid lugemata. Jääb mulje nagu arvaks mõned spordisõbrad, et WADA testimeetodid on kuskilt laest võetud ja nende teadusmeeskonnad ei valda kõige elementaarsemat matemaatilist statistikat. WADA peab pidevalt arvestama, et juhul kui nad eksivad, võivad neid tabada väga suured kahjutasunõuded rääkimata usalduse kaotusest ning selle tõttu disainivad nad ka referentsväärtusi väga kõrgete usalduspiiridega.
Näitlikustamiseks (ilma tegelike arvutusteta) võib aimata ilmselt seda, et tegelikult on WADA teadlased jõudnud järeldusele, et dopingut on juba tarvitatud kui vastavad näidud veres on suuremad kui näiteks 0,9. Järgnevalt arvutab WADA välja usaldusvahemiku (95% on nende jaoks selgelt liiga väike vaid peaks olema vähemalt 99% või isegi veel suurem) piirid. Selle järel saab väita, et kes ületab saadud referentsvahemiku usalduspiiride ülemist väärtust, on peaaegu kindlasti dopingut tarvitanud. Võibolla näiteks leidis WADA (lambist näitena ja ilma infota), et konkreetse testi puhul on usalduspiiriks 0,78. Liites selle 0,9-le, saadakse tulemus 1,68, mis seataksegi referentspiiriks. See tähendab seda, et ükskõik, mis mõõtmistulemus on üle 1,68 on siis vastavalt äärmiselt suure tõenäosusega tegu dopingujuhtumiga (ehk isegi kõikvõimalikke statistilisi tõenäosusi arvesse võttes on sportlase näit kõrgem kui 0,9, mis on tegelikuks dopingu tarvitamise näiduks).
Tegemist oli lihtsalt näitega sellest kuidas WADA tõenäoliselt tegutseb. Praegune suure osa analüüsijate viga seisneb selles, et 1,68 peetakse dopingukasutamise näidu markeriks, samal ajal kui see on selle markeri mõõtmise usalduspiiride ülemine serv.

 
At 11:10, Anonymous Anonüümne said...

@ 10:40

Kõik ilus ja kena, aga ytleme et sa sõidad autoga punkt 90km/h.

Politsei on ajaviiteks väljas kahe radariga. Samas punktis. Samaaegselt mõõdavad kiirust.

Radarid on taadeldud, kiirusel 90km/h on nende eksimus +/- 3km/h

Esimene radar näitab et sa sõitsid 98km/h - 3 == tulemus 95km/h
Teine radar näitab, et sa sõitsid 108km/h - 3 == tulemus 105km/h

Politsei nüüd ütleb et mis sest et näidud erinevad kapitaalselt taadeldud radaritel, mille eksimus ei tohiks ületada 3km/h -- sina ületasid kiirust... Ja sina omateada sõitsid õige kiirusega.

Võib üle kanda ka joobe mõõtmisele.
Lihtsalt mõtteaineks või nii

 
At 11:10, Anonymous Anonüümne said...

Kas peab maja tagant aknast sisse ronima, kui esiuks on lahti?
Millised siis tegelikud väärtused olid? 3.08 ja 2.0 v6i muud? Mitu teaben6uet on ajakirjandus AV juhtumi kohta ESL-le esitanud? Kui 0, siis väidaksin, et ajakirjandus ei tööta.
Jooksuportaalis nt kui tekkis arutelu, miks ja kes maratonitiimi peaks saama, siis EKJL alatreener Toomas Tarm seletas seal asjad korralikult ära.

 
At 11:54, Blogger Michael E.P said...

to 11.10

Sinu eeldused on valed, kui sõidad täpselt 90km/h ja radar näitab 98km/h, siis on tema eksimus suurem kui pluss-miinus 3 (kuna eksimus on juba 8 km/h). Teise radari puhul on eksimus juba veelgi suurem.

Kõige lihtsama seletuse postitaski 10.40. Kui WADA-le on teada, et dopingukasutamine algab näidust 0.98, aga testi usaldusvahemik on 0.7, siis peab su näit veres olema vähemalt 1.68 et saaks kindlalt otsustada dopingukasutamine üle.

 
At 12:02, Anonymous Anonüümne said...

@11.10
Ja su mõte sellega seonduvalt on? Et viga on siis kus? Taatlemises? Või on seade rikkis?
Kui mõõteseade on korrektselt taadeldud, siis eeldatakse, et ta mõõdab korrektselt eeldatud vea piirides. Ainus subjektiivne komponent sinu näites on sinu enda arusaam kiirusest, ehk siis suurima tõenäosusega eksid sa lihtsalt oma kiiruse hindamisel.
Loomulikult saab ühe mõõteseadme ebaloomuliku näidu põhjal kahtlustada, et seade on rikkis (läinud rikki taatlemise järgselt), aga see ei anna põhjust kahtlustamiseks, et KÕIK mõõteseadmed on rikkis.
Teoorias võib ka kogu taatlemise protseduuri kahtluse alla seada kuid taatlemise kui protseduuri puhul on tegu usaldusel põhineva äriga ning selle tõttu on see palju kordi üle kontrollitud.
Võib kahtluse alla seada ka mõõtmismeetodi või mingite väliste tegurite olemasolu, mis niivõrd suure varieeruvuse põhjustasid. Kuid ka meetod on palju kordi üle kontrollitud ja kui mõõtmistingimuste korral ei olnud erakorralisi asjaolusid keskkonnas, siis ei ole põhjust kahtlustada meetodi viga.
Kokku võtvalt võib kahtluse alla seada kõike (ka füüsika toimimise) kuid enamasti osutub vaatamata suurele paranoilisusele tõeks kõige ilmselgem põhjendus.

Oma olemuselt on lihtsustavaks eelduseks ka matemaatiliste statistikute eeldatav normaaljaotuskõver. Ilma selle (või mõne teise lihtsustava jaotuskõvera) eelduseta aga ei ole emeriitprof. E-M Tiidu usalduspiiride arvutamine üldse võimalik. Seega ei ole ka võimalik tulemuste kahtluse alla seadmine.

Siin peitub ka AV jaoks kahe teraga mõõga oht. Nimelt kui me rõhume tema erakordususele, siis ei saa arvestada ka paljude (normaalsust eeldavate) asjaolude või arvutustega, mis muidu võiksid AV seisukohta toetada või vähemalt WADA tulemusi kahtluse alla seada. Aga loomulikult olen ma seisukohal, et AVd ei aita mitte rumalad inimesed ning seda asjaolu (ja veel paljusid teisi mille pealegi ma ei tule) on juba arvesse võetud.
Matemaatika ei ole keeruline teadus ning ei maksa arvata, et WADA või meie poolt tehakse vigu niivõrd elementaarsetes asjades.

 
At 12:03, Anonymous Anonüümne said...

mind ei veena ei EM Tiit, ei Michael E.P ega teised. see teoreetiline jahumine pole absoluutselt konstruktiivne. antud juhul ei ole statistikat võimalik eestlaste jaoks positiivse lahendi ette rakendada. sihile viiks üheselt mõistetav selgitus, ent statistikud seda pakkuda ei suuda. lisaks ei saa ma aru, miks EM Tiidu arvamusest on tehtud meediasündmus. statistikud-matemaatikud on oma seisukohti juba kuid tagasi ajakirjanduses avaldanud. vt. T Riismaa EPL´is. hapukurk?

 
At 12:06, Anonymous Anonüümne said...

10:40 ja Michael E.P

1. WADA on teatanud, et normaalne on 1:1 jaotus

2. Kahjuks ei arvesta te oma arvestustes seda, et naistel on vastav näitaja suurem, mis näitab, et erinevatel organismidel on siiski võimekus normaalolekus seda tasakaalupunkti muuta naissuguhormoonide mõjul ilma igasuguse keemiata.

3. kit2 näitajate suur erinevus a ja B proovis ei vasta WADA poolt tõestatud tühisele vahele, mis näitab, et metoodika on osutunud ebausaldusväärsemaks teatud asjaolude kokkulangemisel, mida metoodika väljatöötamisel ei suudetud varem tekitada ja seetõttu on metoodika ebausaldusväärsus suurem kui disainitud lävemäärad. Mis tähendab, et antud probleemi korral peaks olema lävemäär näiteks kõrgem vale positiivse tulemuse välistamiseks.

4. Kui sõidad Porchega 100-ga vastava märgi mõjupiirkonnas ja politsei mõõdab ühe fööniga 500 meetri kauguselt kiiruseks 200 ja 275 ning teise fööniga 263 ja 273, siis nende kahe katse tulemus näitab, et tegelikku kiirust ei suudetud määrata nende föönide taadeldud veapiirkonnas, mis näitab, et mõõteriistad ei ole antud tingimustel kas korras või on mõõtetingimused osutunud nendele föönidele ebasobilikeks mistahes põhjusel nt päikesetormi mõju tõttu. Seega tuleb uskuda autojuhti kes tegelikult sõitiski 100-ga ehk piirkiirusega lubatud märgi mõjualas.

Mina jään kindlaks sellisele seisukohale. Selle tõestamine on aga keerukam kui nt protokolli valestitäitmisele apelleerimine, sest vaevalt politsei kipub Porche mehe juttu piirkiirusega liikumisest uskuma, sest tahetaks leida hoopis patuoinast ning ilus kiire auto pakub selleks piisavalt alust arvata, et too masin veab fööniga mõõdetud kiiruse lõdvalt välja.

 
At 12:24, Anonymous Anonüümne said...

10:40 - Lõppjäreldusega nõus, aga täpsustaks veel, et otsustuspiir haarab vähemalt kahte tüüpi varieeruvust: näitaja loomulikku varieeruvust inimeste vahel ja mõõtmistulemuste varieeruvust näitaja määramisel. Võib oletada, et piir on seatud nii, et kumbki varieeruvus oleks kaetud tõenäosusega näiteks 99% (või 99,9% vms).

11:10 - Statistika seisukohalt pole olemas sellist asja nagu eksimus +/- 3km/h. On olemas näiteks eksimus +/- 3km/h tõenäosusega 99%. See tähendab, et radar võib eksida ka rohkem kui 3 km/h, aga seda väga väikese tõenäosusega. Kahjuks pole mul infot, mida see eksimus 3 km/h tähendab: kas see on standardhälve, 95% usalduspiir, 99% usalduspiir?

Kui aga sellised andmed tekivad, siis on mitu võimalikku seletust.

1) Kõik seadmed (auto kiirusemõõtja ja mõlemad radarid) on rikkis.

2) Auto kiirusemõõtja on korras, aga mõlemad radarid, kuigi väidetavalt taadeldud, on tegelikult rikkis.

3) Auto kiirusemõõtja ja üks radar on korras, teine rikkis, ning toimus harvaesinev sündmus, kus korras radari mõõtmistulemus jäi väljapoole 3 km/h. Põhimõtteliselt saab välja arvutada ka selle sündmuse tõenäosuse.

4) Kõik seadmed on korras ja toimus harvaesinev sündmus, et mõlema radari mõõtmistulemused jäid väljapoole 3 km/h. Saab välja arvutada ka selle sündmuse tõenäosuse (mis on arvatavasti väiksem kui punkti 3 sündmuse tõenäosus).

Lisaks tuleb arvestada ka auto kiirusemõõtja mõõtmisviga.

11:10 - Ka mina sooviks teada saada näitude tegelikke väärtusi. Kuna aga 3,08 ja 2 kohta seni mingeid kommentaare ei ole, siis leian, et kõige parem on neid lihtsalt ignoreerida ja võtta aluseks senised näidud, mis on avalikud olnud pikemat aega ja mida keegi ümber lükanud ei ole. Ka teaduses on kombeks, et kahtlase väärtusega andmed heidetakse lihtsalt kõrvale.

 
At 12:38, Anonymous Anonüümne said...

Nii, jätkame siis kiiruse teemat, siin jõuti poindini välja küll kuid ei märgatud vist ise.

See oli väga lihtsustatud näide.

Point on, et kui seadmed peaksid mõõtma oma vea piires õigesti, kuid selgub et kahe identse seadme mõõtetulemus samades tingimustes on väga palju erinev. Ja inimene väidab et juba esimene seade näitas valesti. Rääkimata teisest.

Keda või mida siis sellisel juhul uskuda? Inimest, seadet üks või seadet kaks ?

 
At 12:48, Anonymous Anonüümne said...

12:38 - Ma märkasin küll, et seadmete näitude vahemikud ei kattu, aga see ei olegi point. Point on see, et tavaarusaam väljendist "eksimus +/- 3 km/h" ei vasta füüsilisele tegelikkusele.

Kuna meil kehtib süütuse presumptsioon, siis vastuoluliste näitude puhul tuleb otsus langetada inimese kasuks, sest vastuolust võib põhimõtteliselt järeldada ükskõik mida.

 
At 20:51, Anonymous Anonüümne said...

"ajas kõige kiiremat ning samuti vettpidavat teavet Eesti suusatamise viimaste kuude skandaalide kohta..."
vett võibolla peab, aga usaldatav ei ole. Süütuse presumptsioon ka ei kehti.

 
At 00:01, Anonymous Anonüümne said...

Pole enam eriti noor, aga lugedes emeriitprofessori Tiidu statistilist arutlust leidis kinnitust minu mõte, et kunagine õppejõududele seatud eapiir 65a on hädavajalik.
Kui natukene tunda statistikat ja teemat, mille kohta see arutlus käis, siis läheb meel ikka väga mõruks. Kui see arutlus kohtusse jõuab, jääb lolliks mitte ainult Veerpalu tiim, vaid ka Tartu Ülikool, kelle emeriitprofessoriga on tegu.
Ehk statistik väidab, et kui politseinik mõõdab auto kiiruseks 180km tunnis ja kahe tunni pärast sama auto kiiruseks 120km tunnis, siis on kiiruse mõõtmismeetodi/vahendi viga nii suur, et mõõtmisvea järgi võib auto kiirus olla ka alla 90km tunnis ja mingit kiiruseületamist ei olnud.

 

Postita kommentaar

<< Esileht