Corona-Pandemie Prognose Modell V7

Dieser Artikel ist nicht mehr aktuell.

Hier geht zu Version 8 des Modells.

Update: 14.4.2021

Seit Mitte Februar entwickle ich ein vereinfachtes mathematisches Modell mit dem Ziel, den weiteren Pandemie-Verlauf in Deutschland für einige Wochen in die Zukunft mit brauchbarer Genauigkeit abzuschätzen, zumindest soweit das Verhalten der Bevölkerung und/oder die sich ändernden Maßnahmen der Regierung abzusehen sind.

Auch ein Ausblick auf mehrere Monate ist machbar, die Ergebnisse werden aber natürlich ab 4-6 Wochen zunehmend unschärfer und können nur zum qualitativen Vergleich verschiedener Szenarien dienen, wenn man z.B. verschiedenen Maßnahmen simuliert.

Im Folgenden möchte ich die aktualisierte Version 7 vorstellen (Änderungen zu Vorversionen siehe unten in der Änderungs-Historie).

Warum wir Modelle zum Planen brauchen

Für den gesellschaftlichen Diskurs über die Lockerung oder Verschärfung von Maßnahmen erscheint es mir wichtig, dass man verschiedene Strategien im Umgang mit der Pandemie durchspielen und die unterschiedlichen Folgen vergleichen kann.

Denn was uns klar sein sollte: Für exponentielle Wachstums-Prozesse haben wir Menschen in der Regel kein gute spontane Einschätzung. Die meisten von uns bekommen lineare Entwicklungen ganz gut hin, aber Wachstumsprozesse mit kurzen Verdopplungszeiten (Ende März bei 18 Tagen) für 2-3 Monate in die Zukunft korrekt abzuschätzen ist wirklich schwer.

Ziel: Das Jedermann-Modell

Das folgende Modell ist ein sehr vereinfachter Ansatz und ersetzt keinesfalls die hochaufwendigen und komplexen Modelle der Epidemiologen. Meine Zielsetzung ist: Das Modell soll möglichst so einfach sein, dass jeder interessierte Laie sich einlesen kann und den Berechnungsweg nachvollziehen kann. Damit kann sich der Betrachter sein persönliches Bild machen und zu einer eigenen Einschätzung kommen, ob er den Ergebnissen traut, oder nicht.

Dies ist also ein Debattenbeitrag und ich freue mich über jeden, der mich auf Fehler, falsche Annahmen oder Verbesserungsmöglichkeiten hinweist. Ich bitte um Kommentare, Kritik, Verbesserungsvorschläge. Die Google Sheet Datei ist öffentlich einsehbar (Link am Ende des Artikels). 

Soweit möglich vergleiche ich meine Modellberechnungen immer wieder mit anderen Quellen und anderen Prognosen und verbessere das Modell ständig.

Die Grundidee des Modells

Die Grundlage für alle Folge-Berechnungen ist die Berechnung der Fallzahlen für die Zukunft. Mein Modell teilt dafür die Bevölkerung in 5-Jahres-Altersgruppen auf und rechnet für jede Altersgruppe ausgehend von deren Inzidenz von letzter Woche die neue Inzidenz der Folgewoche.

Bei den Berechnungen wende ich einige Vereinfachungen an, die zwar eine gewissen Unsicherheit mit sich bringen, im Rahmen eines exponentiellen Wachstums aber von untergeordnetem Einfluss sein dürften.

Insgesamt ist mein Ziel ein tendenziell optimistisches Modell zu bauen, eine Überdramatisierung bringt uns nichts, wenn doch schon die optimistischen Szenarien unerträglich erscheinen. Wenn die Zahlen eskalieren wird sich auch das Verhalten der Bürger ändern und als Bremse fungieren, was schwer zu berechnen ist.

Vereinfachungen, die mein Modell zu optimistisch sein lassen
  • 60-30% der Infektionen finden in der gleichen Altersgruppe statt, der Rest wird aus den anderen Altersgruppen eingetragen (Herleitung, Quelle). Über 80 hat 70% Eintragung, 20-79 50%, 0-20 nur 40% (empirische Daten aus historischen Daten).
  • Wenn in einer Altersgruppe 80% der Menschen geimpft sind oder infiziert waren, gibt es keine weiteren Neuinfektionen innerhalb dieser Gruppe (“Herdenimmunität”).
  • Eine Impfung oder vorhergehende Infektion schützt zu 100% vor einem schweren Verlauf (=Klinik/ICU/Tod)
  • Eine Impfung oder Infektion schützt zu 80% davor, sich anzustecken und dann andere anzustecken (Quelle CDC)
  • In allen Altersgruppen erfolgen die Ansteckungen mit dem gleichen R-Wert (beschleunigtes Wachstum z.B. in offene/geschlossene Schulen durch Präsenz wird nicht extra berücksichtigt)
  • Der verwendete Impfplan (Erstimpfung für alle Impfwilligen bis Ende Juli) scheint mir eher optimistisch zu sein.
  • Weil in der zweiten Welle die Patienten jünger sind, ist zu erwarten, dass die durchschnittliche Behandlungszeit in der Intensivstation länger ist (die älteren sterben schneller), was die Belegungszahlen ggf. steigen lässt.
  • Nicht berücksichtigt ist, dass es bei sehr hoher Belastung der Kliniken und der Rettungssysteme zu höheren Sterberaten kommt.

Schritt 1: Berechnung der wöchentlichen Fallzahlen

Ich gehe von den wöchentlich verfügbaren RKI-Altersgruppen-Inzidenz-Daten aus und rechne dann jede weitere Woche iterativ weiter. Dabei gehe ich davon aus, dass 88% der Fälle Ende Woche 14 bereits die Mutationen sind (Quelle RKI). Die anderen 12% sind noch der Wildtyp, der beständig verdrängt wird: der Anteil der Mutationen steigt bis Ende Juni auf 99%. Andere Mutationen werden nicht berücksichtigt, ich hoffe, dass das auch noch lange so bleiben kann.

Die Formel für die Berechnung einer Alters-Inzidenz für eine Woche lautet:

t die Kalender-Woche
nAlter(t) Inzidenz je Kalenderwoche für eine Altersgruppe
nAlle(t)Inzidenz je Kalenderwoche für alle Altersgruppen
R7-TageDer 7-Tage R-Wert
(z.B. im Februar war RWildtyp=0,85, RMutationen=RWildtyp +0,35)
iHerdeHerdenimmunität (ich verwende hier 80%)
qAlter(t-2)Die Impfquote für eine Altersgruppe, 2 Wochen vor der betreffenden Kalenderwoche
kSaisonSaisonalität zwischen 100% (Winter) und 80% (Sommer), Sinuskurve von April bis September
kMassnahmen Absenkung der Ansteckung durch z.B. Schnelltests
7/4 Der 7/4 Exponent rechnet die R-Wirkung von 4 Tage Zykluszeit auf eine Woche um
0,3/0,7Der Eintragungsfaktor wird wie o.g. nach Alter verwendet

Alles was wir nun noch brauchen, um die Inzidenzen zu berechnen ist der R7-Tage für jede Woche des zu modellierenden Zeitraums und die sich verändernde Impfrate. Die Reihe der R-Werten müssen wir aus den zu erwartenden Verhaltensänderungen ableiten, wobei mein Modell von den R-Werten für den Wildtyp ausgeht, für die wir bereits Erfahrungen gesammelt habe. Zum Beispiel hatten wir Mitte Januar durch die Lockdown-Maßnahmen einen RWild-Wert von ca. 0,85. Aus diesem berechnet mein Modell dann den RMutation-Wert für die Mutationen, der +0,35 höher liegt.

Schritt 2: Modellierung des Impf-Fortschritts

Neben der o.g. Abfolge der wöchentlichen R-Werte ist der Impffortschritt die Quelle der größten Unsicherheit im Modell, wenn man um mehr als 4-6 Wochen in die Zukunft schaut.

Leider stehen in Deutschland z.Zt. keine Zeitverlaufsdaten der Impfraten der Altersgruppen zur Verfügung. Mein “Impfplan” beruht historisch auf Basis der aktuellen Impfdaten zum 12.4. (16,3% geimpft, 60% der U80).

In der Zukunft gehe ich von der Annahme aus, dass ab Mitte April 2,5 Mio Erstimpfungen pro Woche erfolgen.

Die höchste zu erwartende Impfquote pro Altersgruppe habe ich aus der RKI Studie “Epidemiologisches Bulletin 13/2021” übernommen. Damit ergibt sich folgender Impfplan:

Im Modell rechne ich für die Zukunft vereinfachend nur mit Erstimpfungen, die 14 Tage später Wirkung zeigen. Für U15 habe ich mangels Zulassung noch gar keine Impfungen eingeplant.

Damit ergibt sich aktuell (14.4.20210), wenn wir in den nächsten Wochen keine Änderungen an unserem Verhalten bzw. den Maßnahmen vornehmen (weder Lockerungen noch Verschärfungen) folgender Verlauf der Fallzahlen:

Schritt 3: Berechnung der Todesfälle

Aus den Fallzahlen und deren Altersstruktur können wir jetzt die Todesfälle für jede Woche und jede Altersgruppe berechnen. Die Verstorbenen pro Fall (“Case Fatality Rate”) kann ich mir mit “Todesfälle mit Coronavirus (COVID-19) in Deutschland nach Alter und Geschlecht” aus dem RKI Bericht berechnen.

Entscheidend ist hierbei, dass die Sterberaten natürlich bei den Ü80 ganz besonders hoch liegen, aber auch bei 40-70-Jährigen gibt es ein Sterberisiko, das klar größer null ist:

Im Falle eines Durchlaufens der Infektion durch die gesamte, ungeimpfte Bevölkerung würden sich theoretisch folgende Zahlen an Verstorbenen ergeben (wären nur alle über 50 geimpft, wären es fast 16.000 mögliche Opfer):

Damit kann mein Modell nun die Zahl der Verstorbenen der zweite Welle vom RKI (schwarze Linie) schon gut “nachzeichnen” (für die erst kürzlich vergangenen Wochen sind die RKI Daten immer unvollständig!):

Das RKI gibt zwei unterschiedliche Zeitreihen für die Todesfälle heraus (1,2), die hier beide dargestellt sind im Vergleich zu meiner Modellrechnung. Eine erste Überprüfung des Modells ist also erfolgreich.

Die um 30% erhöhte Sterberate von B.1.1.7 wird entsprechend dem Anteil der Mutationen an den Gesamtinfektionen mit eingerechnet.

Schritt 4: Berechnungen der stationären Aufnahmen (“Hospitalisierungen”)

Erst seit kurzem gibt das RKI wöchentlich Daten zur Altersstruktur der Hospitalisierungen heraus, mit denen man eine “Case Hospitalization Rate” berechnen kann.

Wie man sieht verlaufen diese Raten von November bis Mitte Januar (2. Welle) ziemlich konstant, das dürften also brauchbare Werte sein. Davor gab es wenige Fälle (ungenau durch kleine Losgröße) und ab Februar verändern sie sich drastisch, das dürften statistische Verschiebungen durch die Impfungen sein. Auch Veränderungen in den Dunkelziffern über die Zeit dürften hier reinspielen. Die Werte der letzten 2 Wochen sind unvollständig.

Wenn man die Mittelwerte von November bis Februar vergleicht mit den Daten des Covid-Pandemic-Mortality-Risk-Estimator des “The Economist”, dann sieht man, dass die gut zusammenpassen, die Economist Daten sind aber detailreicher, also verwende ich die für die weiteren Berechnungen (die starke Abweichung bei den 0-4-Jährigen dürften auf eine erhöhte Dunkelziffer bei den Kleinkindern zurückzuführen sein):

Damit ergeben sich im Modell folgende Hospitalisierungs-Zahlen, die auch wieder ganz gut zu den vom RKI veröffentlichten Gesamtzahlen (schwarze Linie) passen:

In den letzten 4 Wochen werden noch Nachmeldungen kommen, dann geht die schwarze Linie auch noch nach oben, wie meine Zahlen.

Schritt 5: Berechnung der Belegung der Intensivstationen

Aus der Studie von Salje et al. habe ich mir die Rate der Patienten herausgesucht, die auf Intensiv mussten und diese mit der o.g. CHR multipliziert:

Damit können wir nun den Verlauf der Belegung der Intensivbetten berechnen (wobei ich als durchschnittliche Belegung 17 Tage verwende):

Wieder ein Cross-Check: Mein Modell zeichnet die offiziellen, historischen Zahlen der DIVI aus der zweiten Welle mindestens gut genug nach.

Bemerkenswert erscheint mir, dass sich das Durchschnittsalter der ITS Patienten vor Juni nicht grossartig ändert in meinen Modellberechnungen. Überprüfen kann ich das nicht, es gibt m.E. keine öffentlichen Daten dazu.

Schritt 6: Berechnung der Anzahl der LongCovid-Patienten

Die Berechnung der Anzahl der LongCovid Patienten erfolgt nach den Daten der Studie Prevalence of ongoing symptoms following coronavirus (COVID-19) infection in the UK: 1 April 2021, die die folgende Angaben zur Wahrscheinlichkeit abgibt, dass ein Patient nach einem positiven Test noch Symptome hat. Diese Wahrscheinlichkeit liegt zwischen 12% und 21%, ich gehe aber nur maximal 180 Tage zurück, für längere Verläufe von LongCovid habe ich keine Daten gefunden. Die Dunkelziffer der nicht als positiver Fall verzeichneten Infizierten ist auch nicht berücksichtigt.

Damit ergibt sich eine immense Anzahl an LongCovid-Fällen:

Wie zuverlässig sind diese Daten?

Wenn sich ein Mensch heute infiziert taucht er/sie i.d.R. erst in 7-10 Tagen in den Fallzahlen auf, und nochmal einige Tage später im Krankenhaus. Die Fälle/Patienten in 7-14 Tagen sind unausweichlich, eine Änderung an unserem Verhalten würde erst in 7-14 Tagen beginnen zu wirken.

Die Hochrechnung der Fallzahlen dürfte – außer es findet ein harter Lockdown statt, das müßte man im Modell in der Reihe der R-Werte ergänzen – für mindestens 3 Wochen in die Zukunft gut genug sein, um damit die weitere Entwicklung auch in absoluten Zahlen gut abschätzen zu können.

Alles zusammen sind die Prognose Daten für die nächsten 4-5 Wochen als gute Näherung anzusehen, wobei – wie oben beschrieben – wir an vielen Stellen auf der optimistischen Seite bleiben, sodass ich ein Abweichen der Zahlen eher nach oben als nach unten erwarte.

Je weiter in die Zukunft es geht, desto unzuverlässiger werden die Zahlen natürlich, dann sollten die Werte nur noch als qualitativer Hinweis auf den Verlauf betrachtet werden. Wenn später dann auch noch die Impfrate/Infektionsrate jenseits 50% liegt bzw. extreme Ereignisse ablaufen, wird es nochmals ungenauer.

Aber wir wollen ja für unsere Entscheidungen heute insbesondere in die nächsten 4-6 Wochen schauen, und dafür scheint mir das Modell geeignet zu sein.

Hier ist abschließend der komplette Modellauf, aus dem die oben gezeigten Daten sind im Vergleich zu den Vorversionen:

Modelllauf vom 14.4.2021:

Die folgende Grafik zeigt, wie sich die Fallzahlen-Vorhersagen mit den Modellversionen verändert haben:

Am Anfang waren die frühen Modellversionen zu optimistisch, dann zu pessimistisch (die bremsende Wirkung der Osterferien wurde unterschätzt), die Version 6 und 7 sind sich aber nun einig über den weiteren Verlauf bis Mitte Mai.

Was man aber sieht: Der Verlauf der Kurve wurde durch die Ostertage nur verzögert, aber nicht abgeflacht. Klar, wir haben ja auch nichts unternommen, um das exponentielle Wachstum nachhaltig zu beenden.

Modell-Historie

Modelllauf vom 7.4.2021:

Modelllauf vom 3.4.2021:

Modelllauf vom 25.3.2021:

Link zum Google Sheet

Das aktuelle Google Sheet steht hier zur Verfügung:

Version 6: https://docs.google.com/spreadsheets/d/1SQQYftE7esDOT_a_Sk63OjpGQ-aFb-DGTKszz4M3g1Q/edit?usp=sharing

Version 5: https://docs.google.com/spreadsheets/d/1nE6gI869DYtJVT3VLlUA98AjhGtK6qhpNBYT_C9mX_I/edit?usp=sharing

Feedback bitte an: https://twitter.com/dpaessler

Änderungs-Historie

3.4.2021 – Version 6
  • Wochen-Altersgruppen-Daten bis KW 12 vom RKI eingepflegt
  • R-Wert Reihe angepasst an aktuelle Entwicklung
  • Impfung oder Infektion schützt nur zu 80% davor, sich anzustecken und dann andere anzustecken (Quelle CDC) (vorher 100%), aber weiterhin: Impfung schützt zu 100% vor ernster Erkrankung
  • Deutlich ambitionierteren Impfplan habe ich von RKI Studie “Epidemiologisches Bulletin 13/2021” übernommen
  • Berechnung der LongCovid-Fälle von Studie übernommen.
  • Darstellung der Infizierten plus Dunkelziffer bei Impfrate
  • Die Modell-Fallzahlen haben sich seit Version 5 wie folgt verändert:
7.4.2021 – Version 6.1
  • Update der neuesten Wochenzahlen des RKI. Das Osterloch fällt mit den aktuellen Zahlen stärker aus, als bisher eingerechnet (ich erwarte das dies teilweise noch mit Nachmeldungen korrigiert wird, ein Teil der Absenkung sind auch zu wenige Tests)
  • Durch die neuen Zahlen des RKI hat sich der weitere Verlauf der Modellberechnungen wie folgt verändert (Aber: wie gesagt, die Zahlen der Woche 13 sind sicherlich zu niedrig ausgefallen):
14.4.2021 – Version 7
  • Impfplan historisch an offizielle Daten angepasst, für Zukunft ab Mitte April rechne ich mit 2,5 Mio. Erst-Impfungen pro Woche.
  • “Eintragung” der Infektionen zwischen den Altersgruppen wurde zusammen mit einigen anderen Parametern basierend auf historischen Daten neu modelliert, weil das Modell in den zunehmend geimpften älteren Altersgruppen zu optimistisch wurde.

Author: Dirk Paessler

CEO Carbon Drawdown Initiative -- VP Negative Emissions Platform -- Founder and Chairman Paessler AG

4 thoughts on “Corona-Pandemie Prognose Modell V7”

  1. Tolles Projekt weil einfach, transparent und extrem nützlich!
    Wo findet man denn andere Modelle dieser Art? Auf den einschlägigen Seiten des RKI, JHU usw. finde ich nichts dazu.

    Like

Comments are closed.