Coronavirus und Lebenserwartung: Statistik Austria verwirrt

Der Standard berichtet:

Die Corona-Pandemie hat den stärksten Rückgang der Lebenserwartung seit Beginn der Aufzeichnungen 1951 ausgelöst. Während wir es in den letzten Jahren gewohnt waren, immer älter und älter zu werden, gibt es nun erstmals einen massiven Knick in der Lebenserwartungsstatistik.

Grund dafür ist eine sehr hohe Übersterblichkeit in den letzten Wochen des Jahres 2020. Neue Daten der Statistik Austria zeigen, dass im gesamten Vorjahr etwa zehn Prozent mehr Menschen starben als im Durchschnitt der vergangenen fünf Jahre. Insgesamt waren es rund 90.000. […]

Konkret heißt das, dass ein Mann, der heute in Österreich geboren wird, im Durchschnitt 78,9 Jahre lang leben wird. Bei einer Frau sind es durchschnittlich 83,7 Jahre. 

https://www.derstandard.at/story/2000123287763/statistik-austria-ueber-90-000-todesfaelle-2020-lebenserwartung-sinkt

Damit sank die Lebenserwartung im Vergleich zum Vorjahr bei Frauen um ein halbes Jahr, bei Männern um etwas mehr. Die Statistischen Ämter anderer Länder lieferten ähnlich verheerende Zahlen: die amerikanische Gesundheitsbehörde CDC meldete sogar einen Rückgang der Lebenserwartung von einem ganzen Jahr.

Diese Zahlen können nicht stimmen.

Experten schätzen, dass ein an COVID-19 Verstorbener im Schnitt 12 Jahre seiner Lebens verlor. Multipliziert man das mit den 8.500 Corona-Toten in Österreich kommt man auf 102.000 verlorene Lebensjahre. Bezogen auf die Gesamtbevölkerung von 8,86 Millionen ergibt das eine durchschnittliche Reduktion der Lebenserwartung von 0,01 Jahren. Das ist ein Rückgang von etwa vier Tagen, nicht sechs Monaten wie der “Standard” berichtet. Der von der Statistik Austria gemeldete Wert ist um das 40-fache zu hoch. Wie kann das sein?

Wie in diesem kurzen Artikel erklärt wird, gehen die Statistikämter bei der Schätzung der Lebenserwartung von einer wesentlichen Annahme aus: nämlich, dass das Sterberisiko in jeder Alterskohorte in Zukunft genauso bleibt wie im Jahr 2020. D.h. die Wahrscheinlichkeit, dass ein im Jahr 2020 geborener Mensch im Alter von X Jahren sterben wird, ist gleich der Sterbewahrscheinlichkeit eines X Jahre alten Menschen im Jahr 2020. Das ist eine sinnvolle Annahme in einem gewöhnlichen Jahr. Aber 2020 war kein gewöhnliches Jahr.

Mit anderen Worten: Die Statistik Austria geht implizit davon aus, dass sich die Corona-Pandemie von 2020 jedes Jahr genauso wiederholen wird. Die Mitarbeiter der Statistik Austria sind sich dieser Annahme natürlich bewusst, weshalb auch auf ihrer Website folgender der Hinweis steht:

Die für ein Kalenderjahr berechnete Lebenserwartung bei der Geburt gibt an, wie viele Jahre ein neugeborenes Kind im Durchschnitt leben würde, wenn sich die im Kalenderjahr beobachteten altersspezifischen Sterberaten in Zukunft nicht mehr ändern würden.

https://www.statistik.at/web_de/presse/125167.html

Nur das Problem ist: Die so geschätzte Lebenserwartung macht für das Jahr 2020 eben leider keinen Sinn. Und der Warnhinweis geht erwartungsgemäß in der medialen Berichterstattung völlig unter. Sogar der “Standard”, der für sich in Anspruch nimmt ein Qualitätsmedium zu sein, (des-)informiert seine Leser, dass ihre Lebenserwartung um 6 Monate gesunken sei, ohne auf die falsche Annahme, die diesem Wert zugrunde liegt, hinzuweisen.

Einigermaßen bizarr ist auch der Titel, den die österreichische Akademie der Wissenschaften für ihren Beitrag zu diesem Thema gewählt hat:

COVID VERRINGERT LEBENSERWARTUNG, STIEHLT ABER KEINE LEBENSJAHRE

Die durchschnittliche Lebenserwartung in Österreich ist laut vorläufigen Zahlen der Statistik Austria im Corona-Jahr 2020 um sechs Monate gesunken. Das heißt aber nicht, dass die Österreicher/innen jetzt weniger alt werden, erklärt Demograph Marc Luy von der ÖAW.

https://www.oeaw.ac.at/detail/news/covid-verringert-lebenserwartung-stiehlt-aber-keine-lebensjahre

Hä? Wenn COVID keine Lebensjahre stiehlt, wie kann sie dann die Lebenserwartung um ein halbes Jahr verringern? Wenn die Lebenserwartung nicht die zu erwartenden Lebensjahre misst, was misst sie dann? Und wozu braucht man dann diese “Lebenserwartung” überhaupt?

In einem normalen Jahr misst die Lebenserwartung das, was jeder glaubt, dass sie misst. Aber eben nicht in einer Pandemie. Die Statistik Austria täte gut daran, die Berechnung der Lebenserwartung für 2020 anzupassen.

(Hat tip to David Friedman, durch den ich auf das Problem aufmerksam wurde.)

Die ökonomischen Konsequenzen des Coronovirus – ein genauerer Schätzer der Dunkelziffer

Es geht hier nochmal um die Dunkelziffer der Coronaviruskranken in Österreich und darum, wie man diese aus der von SORA durchgeführten Stichprobe schätzen kann. Wie schon in meinem vorigen Blogeintrag zu dem Thema erkläre ich hier wieder, wie man die zusätzliche Information, die man über die Coronaerkrankten hat, zu einem genaueren Schätzer nutzen kann. Der Vorteil in diesem Blogeintrag ist der, dass ich genauere Schätzungen bekomme, ohne neue Daten zu erheben. Ich nutze hier etwas mehr von der Information, die SORA in ihrem Bericht geliefert haben.

Continue reading

Coronavirus-Dunkelziffer: alternative Schätzung

Wie ich in meinem Kommentar auf Christophs letzten Blogpost angemerkt habe, gibt es noch einen anderen Weg die Dunkelziffer der Coronavirus-Infektionen zu schätzen.

Für diese alternative Schätzung benötigt man zwei Inputs

  1. Die Infektionsfatalitätsrate (IFR): das Verhältnis der Todesfälle zu den tatsächlich Infizierten
  2. Die durchschnittliche Dauer der tödlich verlaufenden Erkrankungen

Zu beiden Inputs gibt es mittlerweile einige wissenschaftliche Erkenntnisse.

Die derzeit beste (so weit ich weiß) Schätzung der IFR kommt aus einer Zufallsstichprobe im deutschen Ort Gangelt. Dort wurden bei 14% der getesteten Einwohner Antikörper festgestellt, was auf eine vergangene Infektion hinweist. Nur 2% davon waren in der offiziellen Statistik erfasst. Die Fatalitätsrate lag bei 0,37%. Andere Schätzungen scheinen ein ähnliches Ergebnis zu erzielen. Das Centre for Evidence-Based Medicine an der Universität Oxford kommt daher zu dem Schluss:

“Taking account of historical experience, trends in the data, increased number of infections in the population at largest, and potential impact of misclassification of deaths gives a presumed estimate for the COVID-19 IFR somewhere between 0.1% and 0.36%”

Für den zweiten Input, die durchschnittliche Dauer der fatalen Infektionen, habe ich folgende Studie in “The Lancet”, einer führenden medizinischen Fachzeitschrift, gefunden:

“Using data on 24 deaths that occurred in mainland China and 165 recoveries outside of China, we estimated the mean duration from onset of symptoms to death to be 17,8 days”

Auf Basis dieser zwei Zahlen kann man die tatsächliche Infektionszahl wie folgt schätzen:

Tatsächlich Infizierte am Tag t = gemeldete Todesfälle am Tag t+18 / IFR

Zum Beispiel: Österreich hatte zum 14. April insgesamt 368 Todesfälle. Wenn wir eine IFR von 0,36% unterstellen, impliziert das, dass wir am 27. März, also vor 18 Tagen, ziemlich genau 100.000 Infizierte hatten. Davon hatten wohl sehr viele gar keine oder nur schwache Symptome. Eine Studie aus Island legt nahe, dass ca. die Hälfte der Infektionen symptomatisch verläuft. Die offizielle Statistik meldete am 27. März insgesamt 7,029 Infektionen.

Das bedeutet die Dunkelzifferquote, also das Verhältnis der tatsächlichen zu den gemeldeten Infizierten, lag Ende März bei ca. 14.

Wem diese Zahl zu hoch erscheint, sollte bedenken, dass eine IFR von 0,36% am oberen Ende des von CEBM angegebenen Intervalls liegt, d.h. meine Schätzung ist eine konservative.

Nachstehende Grafiken zeigen den Verlauf der gemeldeten und implizierten Fälle sowie die Dunkelzifferquote im März. Daraus geht hervor, dass Anfang März die tatsächlichen Infektionszahlen wahrscheinlich um mehr als das 100-fache höher waren als die offiziell bestätigten. Das ist nicht verwunderlich, weil zu dem Zeitpunkt die Testkapazität noch sehr gering war. Seitdem ist die Dunkelzifferquote stetig gesunken, was wohl an schnelleren und breiteren Tests liegt.

Caveat: Niemand sollte die hier dargestellten Zahlen als die “wahren” Fallzahlen interpretieren. Es handelt sich hier lediglich um Gedanken- und Zahlenspiele auf der Basis sehr ungenauer Daten.

Die ökonomischen Konsequenzen des Coronavirus – Die Dunkelziffer

Um die Dunkelziffer aller am Coronavirus erkrankten Österreicherinnen und Österreicher abzuschätzen, wurde eine Zufallsstichprobe von 2000 Menschen in Österreich durchgeführt, wovon in etwa 1500 mitgemacht haben. Diese hat einen Prozentsatz von 0,33%, sprich 5 coronaviruskranken Personen gefunden. Aufgrund dieses Ergebnisses kann man ein 95%iges Konfidenzband, von etwa 10.200 bis 76.400 für die tatsächlich an Coronavirus Erkrankten in Österreich bestimmen. Ich berufe mich hier auf die Zahlen laut Kurier.

Für diese Konfidenzintervallsberechnung werden ausschließlich die Daten aus dieser Stichprobe verwendet. Mein Vater, Helmut Kuzmics, hat mich gefragt, ob das nicht etwas seltsam ist und ob man das, gegeben das ganze andere Wissen, das man hat, nicht vielleicht stärker einschränken könnte? Oder könnte man nicht vielleicht die Stichprobe anders wählen, um zum Beispiel dem gerecht zu werden, dass in Ischgl viel mehr Fälle bekannt sind als in einer ähnlich großen Gemeinde im Burgenland? Mit einer allgemeinen Stichprobe dieser Art ist es ja leicht möglich, dass keine Person in Ischgl überhaupt in ihr enthalten ist.

Mein Vater hat recht. Man kann das besser machen, wenn man weiß, wie man das Wissen, das man schon hat, nutzen kann. Wie das funktionieren soll, erkläre ich hier anhand eines Gedankenexperiments.  Ich habe für diesen Blogeintrag auch von Diskussionen mit Michael Greinecker profitiert.

Continue reading