Pandemie Vorhersage Modell V4 – Verfeinerung und Validierung

Seit dem Entwicklungsstart meines Prognose-Modells in Kalenderwoche 7 sind schon einige Wochen vergangen. Inzwischen gibt es neue Daten mit denen ich die alte Version 3 meines Modells validieren und verbessern kann. Außerdem gibt es neue Erkenntnisse/Studien, die auch ins Modell rein müssen.

Dieser Artikel beschreibt nur die Veränderungen in Version 4, für die Grundlagen des Modells verweise ich auf den Artikel zu Version 3.

Im nachfolgenden Artikel “Neuberechnung von 5 Szenarien für die nächsten Wochen” wende ich das Modell dann an, um aktuelle Handlungsoptionen neu durchzurechnen.

Teil 1: Validierung

Wenn ich den tatsächlichen Verlauf der KW7 bis KW 10, die jetzt vorliegen, mit meinen Vorhersagen vergleiche, gibt es einige Auffälligkeiten:

Vom 14.2. bis 7.3. mit dem Modell 3 berechnete Daten im Vergleich zu den echten RKI Daten

Negative Werte bedeuten, dass mein Modell zu optimistisch war. Positive Werte bedeuten, dass die Realität besser war als modelliert.

  • Die Gesamtinzidenz in der Woche des 7.3.2021 wurde über 4 Wochen nur um 20% verpasst. Gut.
  • Die Inzidenzen der “alten” Jahrgänge wurde viel zu optimistisch berechnet
    • 1. Grund: Das alte Modell hat schon bei relativ hohen Impfraten die Inzidenz zu optimistisch berechnet und keine Queransteckungen zwischen den Altersgruppen berücksichtigt, dadurch wurden schnell gar keine Infektionen mehr in den hohen Altersstufen modelliert.
    • 2. Ich hätte für die Inzidenz-Berechnung die Impfrate von jeweils 2 Wochen vorher berücksichtigen müssen (Zeit bis Impfung wirkt)
    • 3. Meine Annahmen für die Geschwindigkeit der Impfung waren zu optimistisch
  • Die Inzidenzen der U20 wurden zu optimistisch berechnet (weil: Dass die Wirkung der Schulöffnungen tatsächlich so stark sein würde, habe ich damals aus Vorsicht nicht gewagt zu simulieren)
  • Die 75-79 Jährigen und die 60-69 Jährigen habe ich zu pessimistisch modelliert (weil: In dieser Gruppe wurden offensichtlich schon viel mehr Menschen mit medizinischer Indikation geimpft, als ich angenommen hatte)

Gerade zum letzten Punkt – welcher Anteil welcher Altersgruppe ist schon geimpft – gibt es meines Wissens keine öffentlichen Zeitverlaufdaten. Dabei ist genau der Verlauf der Impfungen in den Altersklassen die Schlüsselfrage für alle Prognosen. Alles andere kann man ganz gut berechnen, modellieren und mit echten Werten abgleichen, bei dem weiteren Verlauf der Impfungen müssen alle Modellierer schätzen und raten – ich auch.

Korrekturen am Modell

Mit den folgenden Korrekturen am Modell wird die Streuung der Werte der Altersgruppen deutlich besser, wie man im folgenden Graphen sieht.

Vom 14.2. bis .7.3. mit dem Modell 4 berechnete Daten im Vergleich zu den echten RKI Daten

Dabei korrigiere ich eher optimistisch, d.h. lieber berechne ich für die Zukunft eher etwas zu niedrige Werte als zu hohe. Durchgeführte Korrekturen:

  • Es wird die Impfrate der Altersgruppe von 2 Wochen vorher verwendet
  • Meinen “Impfplan” habe ich angepasst (insb. die Impfungen aus medizinischer Indikation werden berücksichtigt)
  • Es wird modelliert, dass 30% der Infektionen in einer Altersgruppe aus den anderen Altersgruppen kommen, sodass die hohen Jahrgänge nicht gleich auf Inzidenz null absinken.

Sanity-Check: Am 18.3.2021 waren ca. 25-30% der Ü80 das erste Mal geimpft. In meinem Impfplan sind es 29%. Passt.

Für die Vorhersagen des Modells von heute in die Zukunft können wir denke ich davon ausgehen, dass die berechneten Werte in 5 Wochen eher besser sind als das was kommen würde, mit einer Unsicherheitskorridor von -10% bis -50%. Da wir bis in 5 Wochen (hoffentlich) die Maßnahmen und unser Verhalten verändert haben, werden wir das aber nie erfahren. Denn wenn diese Veränderungen dann Inzidenz-Absenkend sind, dann stimmen meine optimistischen Werte dann wohl wieder.

Wenn man sich die Szenarien ohne Maßnahmen anschaut, mit untragbaren weit fünfstelligen Intensiv-Patientenzahlen, ist diese Fehlerrate sicher verkraftbar. Aus Vorsicht dürfen wir da ja eh nicht ans Limit gehen.

Crosscheck zum DIVI Modell

Wenn ich mein Modell so parametriere wie das DIVI Modell erhalte ich für Notbremse am 22.3. oder am 29.3. folgende Werte für die Intensivbelegung:

Die Vorhersage des DIVI Modells vom 15.3.2021 berechnet 3000 Betten für eine Notbremse etwa am 22.3. und 5000 für Notbremse etwa am 29.3.2021.

Im Rahmen von solchen Prognosen dürfte das gut genug sein…

Neue Mathematische Formel der Berechnung

Damit wird jetzt die Inzidenz einer Altersgruppe für die nächste Woche wie folgt berechnet:

t: die Kalender-Woche
nAlter(t): Inzidenz je Kalenderwoche für eine Altersgruppe
nAlle(t): Inzidenz je Kalenderwoche für alle
R7-Tage:Der 7-Tage R-Wert (Im Februar: RWildtyp=0,85, RMutationen=RWildtyp +0,35)
iHerde: Herdenimmunität (ich verwende hier 80%)
qAlter(t-2): Die Impfquote für eine Altersgruppe, 2 Wochen vor der betreffenden Kalenderwoche
kSaison: Saisonalität zwischen 100% (Winter) und 80% (Sommer), Sinuskurve von April bis September
kMassnahmen: Absenkung der Ansteckung durch z.B. Schnelltests
Der 7/4 Exponent rechnet die R-Wirkung von 4 Tage Zykluszeit auf eine Woche um

Weiterhin ein R-Wert für alle

Ich habe mich dafür entschieden, weiterhin in allen Altersgruppen mit dem gleichen R-Wert zu rechnen. Das stimmt zwar im Detail nicht immer, z.B. Schulen auf/zu verändert den R-Wert der U20 um 0,1-0,2 nach oben bzw. nach unten im Vergleich zum Schnitt:

Image
Quelle: https://twitter.com/dpaessler/status/1372146061142294540

Aber da wir für die Zukunft nicht wissen, wann Schulen offen sind oder nicht, müssen wir das mit in den Gesamt-R-Wert reinstecken beim Modellieren der Zukunft.

Teil 2: Berücksichtigung neuer wissenschaftlicher Erkenntnisse

B.1.1.7 ist nicht nur ansteckender (das wurde im Modell bereits eingerechnet) sondern verursacht auch noch schwerere Verläufe und Sterbefälle. Das kann man jetzt schon an den aktuellen Zahlen ablesen. Die Rate der Todesfälle steigt um 50% mit einer B.1.1.7 Infektion, vielleicht sogar mehr. Im Modell rechne ich dies nun mit dem Anteil der B.1.1.7 Infektionen am Infektionsgeschehen mit ein, für Todesfälle, Intensiv-Fälle und Hospitalisierungen.

Damit kann mein Modell jetzt die veröffentlichten Sterbefälle des RKI noch genauer nachzeichnen, das ist also richtiger als vorher.

Die Ergebnisse sind logischerweise nicht schön, die Belastung der Kliniken steigt bei gleicher Fallzahl damit um ca. 50% ab Mitte März, während sich B.1.1.7 durchsetzt.

Bessere Daten über Hospitalisierungen

Bisher hatte ich die Krankenhaus-Zugänge aus der Anzahl der Intensivpatienten berechnet. Nun gibt es einen neuen Datensatz des The Economist, an den ich jetzt meine Hospitalisierungs-Vorhersage angepasst habe.

Damit liegen in der Summe die Krankenhaus-Einweisungen der jüngeren Jahrgänge etwas besser (im Mai-Peak ca. 30% niedriger). Leider kenne ich keine besseren Daten, mit denen ich das besser modellieren könnte oder einen Cross-Check machen könnte, u.a. weil es in Deutschland keine passende für das gesamte Land konsolidierte Datensammlung gibt (bitte gerne schicken, wer sowas hat).

So, und jetzt können wir die 5 Szenarien aus meinem Artikel Countdown zur Lockdown-Verschärfung in 3-2-1 Wochen nochmal neu rechnen im nächsten Artikel: “Neuberechnung von 5 Szenarien für die nächsten Wochen”

Author: Dirk Paessler

CEO Carbon Drawdown Initiative -- VP Negative Emissions Platform -- Founder and Chairman Paessler AG