Coronavirus: Dateninterpretation

In der Epidemiologie gelten für Statistik andere Regeln als in den sanfteren Wissenschaften – 3% Gewinn ist was anderes als 3% Tote, das hat auch gute Gründe.

Und weil das so wichtig ist, halten echte Epidemiologen – nicht: Aktivisten – normalerweise die Klappe, wenn sie ein RR (relatives Risiko) unter 3 haben – nicht so Aktivisten, denen reicht das übliche RR > 1 mit 95%-Konfidenzintervall. Problem für diese: Es gibt recht wenige Sachen, die ein RR > 3 zustandebringen. Pest und Cholera, vielleicht, aber das Coronavirus mit (sinnvollen) Mortalitätsraten von 3,5% bei einer Grundmortalität von 1,25% ist halt nicht das dreifache.

[Servicehinweis: Ich vereinfache Statistik hier ganz enorm. Lest ggf. dieses Buch, dann dieses Buch, dann dieses Buch, und zur Sicherheit, weil’s um medizinische Themen geht, werft noch einen Blick in dieses Buch. Sind kaum 2.000 Seiten.]

Der Faktor 3 liegt darin begründet, dass man – bei einer ausreichend großen Grundgesamtheit, und “die Menschheit” ist eine ziemlich große Grundgesamtheit – bei einem 95% – Konfidenzintervall (das bedeutet, mit einer Wahrscheinlichkeit von 5% ist alles Müll, was Du redest) durchaus wahrscheinlich etwas “findet”, was in der Realität schlicht nicht existiert.

Einfaches Beispiel: Wenn mein Serumtest auf Coronavirus-Antikörper 5% false positives meldet, und ich 100 Papayas teste, ist die Wahrscheinlichkeit dafür, dass keine der Papayas negativ auf Corona getestet wird, bei der ersten Papaya 95%, bei der zweiten auch…. und für alle 100 Papayas 0,95^100 = 0,6%. D.h., ich werde mit über 99% Wahrscheinlichkeit eine Corona-infizierte Papaya finden, wenn ich nur 100 teste. Obwohl Papayas kein Corona haben können.

Das zweite ist Sample: Wenn ich 1.000 Menschen – oder mir wegen 10.000 Menschen – nehme, tue ich das aus einem Pool von 8 Milliarden Menschen. Es gibt recht viele Möglichkeiten, 10.000 aus einem Pool von 8 Milliarden zu ziehen – das sind grob 8 Milliarden Möglichkeiten für den ersten Probanden, 8 Milliarden für den zweiten Probanden…. das multipliziert sich zu einer Zahl mit 10.009 Nullen. Natürlich, geteilt durch Permutationen, aber das sind immer noch 10.005 Nuller.

Du hast also 3.000 Leute in Bumsdorf auf Corona getestet und wagst es, daraus eine Aussage abzuleiten? Ey, ich könnte 50 Seiten nur mit den Nullen der Zahl (!) volldrucken, wieviele Samples es gibt, und dann noch etwas mehr als 49 Seiten mit nur den Nullen der Zahl, wieviele Samples es gibt, die Dein Ergebnis bestätigen, obwohl Dein Test gar nichts misst.

Da man sonst aber gar nichts forschen könnte, hat man sich da auf den “höheren” Faktor 3 geeinigt, statt so einen Quark wie “Frauen verdienen 20% weniger als Männer” zu reproduzieren (das wäre ein RR von 0,8, respektive 1, 25 wenn es ein Virus wäre). 1,25 ist kleiner als 3. Kleiner als 3 ist epidemiologisch wertloser Bullshit – Feminismus ist allgemein wertloser Bullshit.

Epidemiologen sollten das eigentlich wissen, übrigens.

Deswegen, übrigens, hören wir gerade auch herzlich wenig von Epidemiologen. Gottpapst Drosten ist Virologe; Trumps Fauci ist Immunologe – Ärzte, halt. Epidemiologie ist was mit Statistik, das ist schwierig und nachdenken; Medizin ist ausprobieren und auswendig lernen. Da ist ein Unterschied – etwa der, ob du weißt, was 2! ist – oder halt nicht. Das ist 8te Klasse, wir sind hier nicht in Afrika.

Jeder Mediziner hat “exponentielle Ausbreitung von Viren” in seinem Studium auswendig lernen müssen, daher sind die toll geeignet dafür, der dummen (und statistisch völlig ahnungslosen) Bevölkerung exponentielles Wachstum angstmachend zu erklären. Das ist gut und richtig, habe ich auch.

Das liegt daran, dass exponentielles Wachstum (aus meinem Post vom 17.04.) so funktioniert – wenn’s linear aussieht, kommt der Bumms (wahrscheinlich) erst noch.

Nun ist das Problem an theoretischer Statistik, dass ich theoretisch so ziemlich alles modellieren kann, wie den Weltuntergang durch eine unter der Messungenauigkeit liegenden globalen Erwärmung oder so, da muss man noch nichtmal die Abluft einer Klimaanlage neben dem Messgerät einbeziehen.

Aber, ja, Ende April sah das überhaupt nicht gut aus – jetzt aber schon (Quelle):

Das ist eine schöne Welle. Wellen, hatte ich erklärt, sind was, was in der Natur vorkommt. Wellen sind “richtig”. Natur untersuchen und keine Welle finden, das ist recht sicher schlicht falsch.

Das, aber, ist eine Welle.

Nun ist das nette an dieser Grafik, dass sie für den Statistik-nicht-verstehenden Laien, der nicht weiß, wie exponentielles Wachstum funktioniert, tatsächlich dazu herangezogen werden könnte, zu erklären, wie toll die von unserer Gottkanzlerin (und Herrn Söder) beschlossenen Maßnahmen “gewirkt” haben – sieht doch, vor allem, wenn ich das bösartigerweise einzeichne, auch der letzte Depp, dass eine Woche nach den Quarantänemaßnahmen die Infektionszahlen “endlich” fallen.

Interessanterweise sind sich dazu aber sogar die staatlichen Propaganda-Macher zu gut – oder zu unbedarft – aber man kann das schon so argumentieren. Es ist halt Unsinn; das ist eine lineare Skala, Viren wachsen aber exponentiell, da braucht man also eine logarithmische Skala, auf der eine Kurve zu sehen sein müsste; und auf logarithmischen Skalen sieht das eher flach aus.

Nun ist das Problem an logarithmischen Skalen, dass die 99% der Leute nicht verstehen, und es verstehen 99% der Leute schon keine arithmetischen Grafiken, von daher nehme ich in meinen Updates ja relative Zahlen, wie die Infektionsrate, damit die wenigstens 1% der Leute versteht und nicht nur 0,01%.

Oder, mirwegen, wie unsere große Staatsratsvorsitzende mit einem Grenzwert von 50 Neuinfektionen pro 100.000 Einwohner – das ist zumindest mal ein Quotient und nicht die seit Monaten durch die Medien geprügelten absoluten Zahlen: “Heute 35 neue Fälle in Hinterbumsdorf”. Das sagt uns nämlich: Gar nichts.

50 Fälle / 100.000 Einwohner – wenn die 3 Wochen krank bleiben, sind das 1.000, von denen (maximal) 20% ein Intensivbett brauchen, also 200 – wir haben grob 30.000 Intensivbetten, die Hälfte davon frei, und hatten 2 Monate Zeit, mehr zu schaffen – das sind mindestens 15.000 Betten / 80 Mio Einwohner = 18.75 Intensivbetten / 100.000 Einwohner.

Wir sehen, Merkels Zahl (die wollte wohl 35, aber das ändert nix) ist vollkommen beliebig.

Das könnte man, sinnvollerweise, kritisieren. Werde ich aber nicht tun, ich hab nur noch für vier Wochen Zigaretten und hätte gerne die Grenze nach Tschechien (-43%) oder zumindest Österreich (-26%) wieder offen. Mal abgesehen davon gibt es meine Marke in Deutschland nicht.

Die Interpretation

Kommen wir zum Punkt: Ich habe gestern sinnvolle Statistiken gepostet, und eine (zwar alkoholreiche) Nacht drüber geschlafen. aber wenn ich anhand der besten vorliegenden Daten die Coronavirus -Situation beurteilen soll, dann kommt da folgendes raus:

(1) Das Virus ist potentiell sehr ansteckend mit einer Ansteckungsrate (nennen wir sie R) von etwa 2-3, wie das die WHO und alle Studien sagen – praktisch aber nicht. Ich war vor über 10 Jahren das letzte Mal in Wuhan, aber da ist alles sackvoll, da leben Millionen Menschen, da isses eng. Dito New York City. Das sind prädestinierte Hotspots, eine gedrängt volle U-Bahn hat den gleichen Effekt wie ein Rockkonzert, nur kleiner. Da gehen arme Leute (sonst würden sie Auto fahren) hin, dann “pflegen” sie halbherzig und schlecht bezahlt alte Menschen, und die verrecken dann wie die Fliegen.

(1a) es ist daher eine sinnvolle Maßnahme, Großveranstaltungen (temporär oder mirwegen 2 Jahre) zu verbieten.

(1b) Es wäre eine identisch sinnvolle Maßnahme, ÖPNV (temporär) zu verbieten. Hat aber keiner gemacht. (für 2 Billionen kann man einer Menge Leute Taxis zur wichtigen Arbeit zahlen, kommt mir nicht mit Geld). Da trifft man nämlich vollkommen Fremde Leute  über längere Zeit.

(2) Das Virus ist allein durch die Einschränkung von Großveranstaltungen am Aussterben. (1b) ist offenbar nichtmal nötig.

(2a) Alles darüber hinausgehende ist recht offensichtlich auch unnötig.

(3) Das Virus hat im Wochenzyklus ups & downs. Weil? Nun: (a) Das Virus hat sich einer Gewerkschaft angeschlossen oder beachtet den Sabbat, oder (b) die Labore arbeiten an Wochenenden weniger. Ich tippe auf (b).

(4) Wir sind da, pandemietechnisch, als Welt ganz, ganz enorm gut durchgekommen. Die Sache ist eigentlich gegessen. Wir werden keine Großveranstaltungen mehr haben (zumindest sinnvollerweise), bis so kommendes Jahr. Da trifft man nämlich andere Leute als seine üblichen. “Freunde treffen” – das ist bei niemandem ein unendlicher Kreis, nicht in 4-14 Tagen.

Kurz zurück zur Statistik: Ich habe, sagen wir mal, 30 Freunde. Die haben auch 30 Freunde, aber das überschneidet sich zu 50%. Da sind wir dann aber halt bei Achilles, der die Schildkröte mit Vorsprung nicht überholen kann, weil sie infinitesimal weiter ist, bis Achilles sie eingeholt hat – die Summe einer unendlichen (infinitesimalen) Reihe muss aber halt  nicht unendlich sein. Ich kann mirwegen 3 Leute anstecken, die 3, die wieder 3, etc.pp.. bist Du recht schnell bei Millionen, Milliarden, der Welt. Real sind das keine 200 Leute (wenn die nicht U-Bahn fahren).

(5) So ansteckend ist das Virus offenbar nicht. Nach Erdogans plötzlicher Türkeischließung vor ein paar Wochen waren Hinz und Kunz (eher Mohammed und Muhammand) einkaufen – alle infiziert? Mitnichten.

(5a) Es erfordert offenbar einiges an sozialer Interaktion, um sich anzustecken. Theoretisch hustet ein Infizierter Billionen Viren aus, und ebenso theoretisch braucht man nur einen abzubekommen, aber trotz 2 Monaten ohne Masken im Supermarkt – und ohne, dass sich jemand an irgendwelche Abstandsregeln gehalten hätte – gehen die Infektionszahlen runter. Die Evidenz spricht gegen 1,5m, 2m oder 6 Fuß Abstand – und gegen Masken.

(5b) Lange Kontakte indizieren – ohne Belege – eine Infektion, aber dass kurze Interaktionen jemanden infizieren könnten, ist wischiwuschi.

(5c) Ein Verbot von Großraumbüros würde mit an Sicherheit grenzender Wahrscheinlichkeit einen Großteil der wirtschaftlichen Schäden durch totalitäre Idiotie wettmachen – und dafür gibt’s mehr Evidenz als zB für Masken.

(6) Ich teile vollkommen die Einwände der Kritiker faulen Lehrer an den Schulöffnungen. Das sind recht große Veranstaltungen, die zu x-zigt in schlecht ventilierten Räumen sitzen. Wenn das OK sein soll, wäre alles bis zu x Personen OK. Ich gehe aber damit d’accord, dass alles bis zu x Personen recht offensichtlich OK ist – mit einem x=50, siehe Schweden.

D.h., auch 50 Leute in einer U-Bahn wären tragbar. Sind sie ja nun auch, siehe: Zahlen.


So – schaumamal, wie dieser Post altert. In ein, zwei Monaten wissen wir mehr. Ich bin ja schließlich kein Hellseher, “Virologe” oder Klimaprophet. Ich kann falsch liegen.

One Reply to “Coronavirus: Dateninterpretation”

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d bloggers like this: