Tak jsem se zase jednou podival na zpravy o COVIDu a nepotesily me - ani ne tak hodnotama (ktere jako nic moc), jako metodikou, ktera je stale zamerena spis na straseni, nez informovani.
Jednak samozrejme do poctu umrti "s covidem" jsou zahrnuty i pripady napriklad autohavarii, kde dotycni zemreli na rozdrceni, covid, necovid, (cili covidu toto tezko davat za vinu, zda ho u mrtvol detekovali ci ne nevypovida nic), ale to uz vetsina rozumnych lidi nejak chape, ze "s covidem" znamena jak "na covid", tak pripady kde covid prispel ke zhorseni prubehu nemoci, tak pripady zcela nesouvisejici (autonehody, vrazdy ze zarlivosti atd.). Samozrejme cim vic mrtvych, tim lepsi titulky a prodejnost, chapeme.
Co me rozlobilo dnes je vec jina.
Pri srovnavani umrti na covid se pouzil dlouhodoby prumer a "nadumrti" cili pocet zemrelych minus ten prumer. Bylo konstatovano, ze v nekterych obdobich je pocet "nadumrti" dokonce vyssi, nez pocet umrti na covid (nekde snad dokonce i nez "s covidem") (so far so good) a "medialni zaver" typu "vidite jak je ten covid strasny" (i kdyz od celkoveho poctu umrti odecteme jeho obeti, tak je vic mrtvych nez v prumeru - o hruzo - bojte se ho vsichni - az takhle hrozny je. Me to prijde naopak jako jasny dukaz, ze krome covidu tu jsou i jine priciny tech 'nadumrti' - a jednou z nich je prosta statiska)
Me by prislo rozumne pri porovnavani celkoveho poctu umrti uvest graf umrti po jednotlivych letech, s vyznacenim jak letosniho roku, tak i obou dalsich extremu - nejvyssiho a nejnizsiho poctu za dane obdobi.
Totiz prumer ve statistice vyrazne vyhlazuje vysledky a proto se taky pouziva rozptyl.
Zminoval jsi, ze sis poridil kostku. pokud neni cinknuta, tak v prumeru padne 3.5 - cim dele budes hazet, tim vic se to k tomutu prumeru bude blizit. Zaroven je jasne, ze uz pri par hodech ti nejsis padne nejaka ta 1 a nejaka 6. Pokud jako pokus budes brat soucet N hodu, tak prumer pujde k 3.5xN, se stale ridsimi extremy od N do 6xN (a casem se ta cisla budou blizit normalnimu rozdeleni, cili gausove krivce, kterou jsi tak poeticky popsal).
Takze pokud bys mel kostku cinknutou o covid, a chtel ukazat, jak moc je ta kostka cinknuta o covid, tak bys mel uvest jak maxima v jednotlivych mesicich, tak minima v nich, tak prumer a do toho vynest hody tou kovidovou kostkou, pak by to melo vyrazne vetsi vypovidaci hodnotu. Dokud nevime, jak moc divoce se to lisilo v ruznych letech za dany mesic ci den ci jine merene obdobi, tak ukazat, ze ted je to nad prumerem o tolik a tolik moc nerika.
Pokud vezmes treba desetilety prumer, tak v nem skoro jiste najdes jak roky podprumerne, tak nadprumerne, i kdyz tehdy covid nebyl.
Jinymi slovy - pokud si ted hodis za kazdy mesic treba 10x, v prumeru nahazes asi tak 35 pro kazdy mesic, kdyz si to udelas za 10 let zpatky, tak ti ten prumer k 35 pujde mnohem rychleji.
Kdyz si ted vezmes kostku, ktera je "cinknuta o covid - jen nevis jak moc" a nahazes si jeden rok s ni a prumer ti vyjde 38 (=nadumrti 3), tak jednoduchy zaver je, ze je "cinknuti" je 3 na mesic a 0.3 na hod a to je presne vliv covidu - pokud to vyneses do grafu s prumerem tech regulernich hodu, tak ti to tak nejak vyjde a pokud to budes brat jako pocty tisicu mrtvych, tak mas hned jasno.
Ale pokud si do grafu vyneses jednotlive "roky", tak najednou to "jasno" nebude tak uplne jiste, protoze tam budou roky lepsi a horsi a bude videt, ze teda to cinknuti taky muze byt (oproti lepsim letem) vyssi, nebo (oproti horsim letem) nizsi.
A ze u 0.3 nejde s jistotou prohlasit, ze je to nutne cinknute, natoz o tuto presnou hodnotu.
Pokud by ti ten pokus vysel 45 (=nadumrti 10), tak to pravdepodobne cinknute je, ale tezko rict, zda o presne 1.0, nebo treba jen o 0.8, nebo naopak o 1.2.
Coz uz jsem podobne uvahy nikde v novinach nezaznamenal.
A pokud ti vyjde, ze tech "nadumrti" je vic, nez je pocet umrti "na covid", nebo dokonce "s covidem", tak z toho grafu, kde budes mit nejen pumer 10 let, ale i jednotlive roky bude spis vyplyvat, ze tento rok byl proste mezi temi horsimi i bez covidu, nikoli ze covid je tak strasny, ze kvuli nemu umira vic lidi nez "s covidem" celkem.
----
Ostatne pokud provedes ty pokusy pro 11 "let" s obycejnou kostkou a pak vyberes ten nejhorsi (nejvyssi) vysledek a das ho na konec, tak ti vyjde "novinarsky naprosto jasny pandemicky rok" oproti tem predchozim.
----
Jo a to je taky duvod, proc tvrzeni typu "toto je nejhorsi pripad za poslednich 7 let" mam tendenci cist "pred 8 lety bylo hur", protoze jinak by tam misto 7 logicky uvedli vyssi 8. Plati zejmena pro cisla "podivna bez duvodu", u 10, 100, 1000 je to ponekud meze podezrele, stejne jako u cisel typu "od vynalezu vakcinace", nebo "od jine zasadni zmeny, co na to asi ma vliv"
----
Jakoze rozhodne nezpochybnuju, ze covid je problem (to bych jinak nezil rok ve skoro karantene), ale demonstruju, ze (o jake prekvapeni) tisk dava prednost senzacim pred presnosti, ci spravnosti a rad vyvozuje extremni zavery i z dat, ktera ukazuji neco jineho.