Corona-Pandemie Prognose Modell V10

Seit Mitte Februar entwickle ich ein vereinfachtes mathematisches Modell mit dem Ziel, den weiteren Pandemie-Verlauf in Deutschland für einige Wochen in die Zukunft mit brauchbarer Genauigkeit abzuschätzen, zumindest soweit das Verhalten der Bevölkerung und/oder die sich ändernden Maßnahmen der Regierung abzusehen sind.

Auch ein Ausblick auf mehrere Monate ist machbar, die Ergebnisse werden aber natürlich ab 4-6 Wochen zunehmend unschärfer und können nur zum qualitativen Vergleich verschiedener Szenarien dienen, wenn man z.B. verschiedenen Maßnahmen oder den Einfluss neuer Mutationen simuliert.

Im Folgenden möchte ich die aktualisierte Version vorstellen (Änderungen zu Vorversionen siehe unten in der Änderungs-Historie).

Es gibt auch ein Video mit Live-Vorstellung des Modells (Video zeigt Version 8 vom 26.4.2021).

Warum wir Modelle zum Planen brauchen

Für den gesellschaftlichen Diskurs über die Lockerung oder Verschärfung von Maßnahmen erscheint es mir wichtig, dass man verschiedene Strategien im Umgang mit der Pandemie durchspielen und die unterschiedlichen Folgen vergleichen kann.

Denn was uns klar sein sollte: Für exponentielle Wachstums-Prozesse haben wir Menschen in der Regel kein gute spontane Einschätzung. Die meisten von uns bekommen lineare Entwicklungen ganz gut hin, aber Wachstumsprozesse mit kurzen Verdopplungszeiten für 2-3 Monate in die Zukunft korrekt abzuschätzen ist wirklich schwer.

Ziel: Das Jedermann-Modell

Das folgende Modell ist ein sehr vereinfachter Ansatz und ersetzt keinesfalls die hochaufwendigen und komplexen Modelle der Epidemiologen. Meine Zielsetzung ist: Das Modell soll möglichst so einfach sein, dass jeder interessierte Laie sich einlesen kann und den Berechnungsweg nachvollziehen kann. Damit kann sich der Betrachter sein persönliches Bild machen und zu einer eigenen Einschätzung kommen, ob er den Ergebnissen traut, oder nicht.

Dies ist also ein Debattenbeitrag und ich freue mich über jeden, der mich auf Fehler, falsche Annahmen oder Verbesserungsmöglichkeiten hinweist. Ich bitte um Kommentare, Kritik, Verbesserungsvorschläge. Die Google Sheet Datei ist öffentlich einsehbar (Link am Ende des Artikels). 

Soweit möglich vergleiche ich meine Modellberechnungen immer wieder mit anderen Quellen und anderen Prognosen und verbessere das Modell ständig.

Die Grundidee des Modells

Die Grundlage für alle Folge-Berechnungen ist die Berechnung der Fallzahlen für die Zukunft. Mein Modell teilt dafür die Bevölkerung in 5-Jahres-Altersgruppen auf und rechnet für jede Altersgruppe ausgehend von deren Inzidenz von letzter Woche die neue Inzidenz der Folgewoche.

Bei den Berechnungen wende ich einige Vereinfachungen an, die zwar eine gewissen Unsicherheit mit sich bringen, im Rahmen eines exponentiellen Wachstums aber von untergeordnetem Einfluss sein dürften.

Insgesamt ist mein Ziel ein tendenziell optimistisches Modell zu bauen, eine Überdramatisierung bringt uns nichts, wenn doch schon die optimistischen Szenarien unerträglich erscheinen. Wenn die Zahlen eskalieren wird sich auch das Verhalten der Bürger ändern und als Bremse fungieren, was schwer zu berechnen ist.

Angenommene Schlüsselzahlen und Vereinfachungen
  • 50-20% der Infektionen finden in der gleichen Altersgruppe statt, der Rest wird aus den anderen Altersgruppen eingetragen (Herleitung, Quelle).
  • Eine Infektion schützt zu 50%-80% für mind. 6 Monate vor Reinfektion (Quelle).
  • Die erste Impfung vermeidet 70% der Neuansteckungen, 14 Tage nach der zweiten Impfung wird eine Ansteckung zu 90% verhindert (aus den historischen Daten abgeleitet).
  • Die erste Impfung vermeidet 50% der schweren Verläufe (=Klinik/ICU/Tod), 14 Tage nach der zweiten Impfung werden schwere Verläufe zu >95% verhindert (Quelle).
  • In allen Altersgruppen erfolgen die Ansteckungen i.d.R. mit dem gleichen R-Wert (beschleunigtes Wachstum z.B. in offene/geschlossene Schulen durch Präsenz wird nicht extra berücksichtigt), aber bei Kleinkindern unter 5 Jahren liegt der R-Wert 30% niedriger während er bei Ü80 um 50-100% höher liegt (aus den historischen Daten abgeleitet).
  • Bis August werden alle Impfwilligen Erwachsenen 2x geimpft, ab Juni gibt es Impfungen für die Gruppe 12-16, ab September für die U12.
  • Nicht berücksichtigt ist, dass es bei sehr hoher Belastung der Kliniken und der Rettungssysteme ggf. zu höheren Sterberaten kommt.

Schritt 1: Berechnung der wöchentlichen Fallzahlen

Ich gehe von den wöchentlich verfügbaren RKI-Altersgruppen-Inzidenz-Daten aus und rechne dann jede weitere Woche iterativ weiter. Dafür berechne jede Iteration drei mal: mit R-Werten für den Wild-Typ (der im Mai 2021 fast schon komplett verdrängt wurde), für B.1.1.7 und zusätzlich kann eine Mutation wie B.1.617.2 ab Mai hinzugenommen werden.

Aus einem RWild, dem R-Wert des Wildtyps für den wir Erfahrungswerte aus 2020 haben (welche Maßnahmen/Verhaltensweisen erzeugen welchen RWild-Wert?) berechne ich die R-Werte für B.1.1.7 ( RWild + 0,35) und B.1.617.2 (RWild +x). Schätzwerte für RWild sind z.B.: November 2020= 1,0; März 2021=1,1; Oktober 2020=1,3).

Die Formel für die Berechnung einer Alters-Inzidenz für eine Woche lautet:

t die Kalender-Woche
nAlter(t) Inzidenz je Kalenderwoche für eine Altersgruppe
nAlle(t)Inzidenz je Kalenderwoche für alle Altersgruppen
R7-Tage (t)Der 7-Tage R-Wert in einer Woche (beeinflusst durch Lockerungen/Einschränkungen und Verhalten der Bevölkerung, z.B. im Februar war RWildtyp=0,85, RAlpha=RWildtyp +0,35, RDelta nochmals ca. 20-50% höher)
0,7/0,3Beispielwerte für Queransteckung
qAlter(t)Impfquote in einer Woche für eine Altersgruppe, inklusive Wirkungsrate der 1. (nach 2 Wochen) und 2. Impfung (8 Wochen nach 1. Impfung)
kSaisonSaisonalität zwischen 100% (Winter) und 80% (Sommer), Sinuskurve von April bis September
kMassnahmen Absenkung der Ansteckung durch z.B. Schnelltests
7/4 Der 7/4 Exponent rechnet die R-Wirkung von 4 Tage Zykluszeit auf eine Woche um

Alles was wir nun noch brauchen, um die Inzidenzen zu berechnen sinde R7-Tage (t) für jede Woche des zu modellierenden Zeitraums – bei mir ausgedrückt in RWild. Die Reihe der RWild-Werten müssen wir aus den zu erwartenden Verhaltensänderungen ableiten. Zum Beispiel hatten wir Mitte Januar durch die Lockdown-Maßnahmen einen RWild-Wert von ca. 0,85. Aus diesem berechnet mein Modell dann den RMutation-Wert für die Mutation B.1.1.7, der +0,35 höher liegt. Ab Mai kann eine weitere Mutation (z.B. B.1.617.2) gerechnet werden mit wiederum eigener Eingabe für die R-Wert Erhöhung.

Schritt 2: Modellierung des Impf-Fortschritts

Leider stehen in Deutschland keine Zeitverlaufsdaten der Impfraten der Altersgruppen zur Verfügung. Mein “Impfplan” verwendet einige Annahmen und folgt den historischen Impfdaten (lt. www.zeit.de) sehr gut.

Zum 12.5.2021 veröffentlichte das RKI Altersdaten der Impfraten, die passen sehr gut zu meinem Modelldaten:

Der weitere Verlauf der Impfungen ist im Modell wie folgt hinterlegt:

Die höchste zu erwartende Impfquote pro Altersgruppe habe ich aus der Studie “ECOS survey 6th wave” des Hamburg Center for Health Economics übernommen. Damit ergibt sich folgender Impfplan:

Damit würde sich aktuell (12.6.2021) in den nächsten Wochen der folgende weitere Verlauf, wenn wir keine Änderungen an unserem Verhalten bzw. den Maßnahmen (weder Lockerungen noch Verschärfungen) haben und ohne Auftreten von ansteckenderen Mutationen:

Schritt 3: Berechnung der Todesfälle

Aus den Fallzahlen und deren Altersstruktur können wir jetzt die Todesfälle für jede Woche und jede Altersgruppe berechnen. Die Verstorbenen pro Fall (“Case Fatality Rate”) kann ich mir mit “Todesfälle mit Coronavirus (COVID-19) in Deutschland nach Alter und Geschlecht” aus dem RKI Bericht berechnen.

Entscheidend ist hierbei, dass die Sterberaten natürlich bei den Ü80 ganz besonders hoch liegen, aber auch bei 40-70-Jährigen gibt es ein Sterberisiko, das klar größer null ist:

Damit kann mein Modell – unter Berücksichtigung des Schutzes der Impfungen von bis zu 95% vor schwerem Verlauf – nun die Zahl der Verstorbenen der zweite Welle vom RKI (schwarze Linie) schon gut “nachzeichnen” (für die erst kürzlich vergangenen Wochen sind die RKI Daten immer unvollständig!):

Das RKI gibt zwei unterschiedliche Zeitreihen für die Todesfälle heraus (1,2), die hier beide dargestellt sind im Vergleich zu meiner Modellrechnung. Eine erste Überprüfung des Modells ist also erfolgreich.

Schritt 4: Berechnungen der stationären Aufnahmen (“Hospitalisierungen”)

Das RKI gibt wöchentlich Daten zur Altersstruktur der Hospitalisierungen heraus. Wenn man die Werte dort von November bis Februar vergleicht mit den Daten des Covid-Pandemic-Mortality-Risk-Estimator des “The Economist”, dann sieht man, dass die gut zusammenpassen, die Economist Daten sind aber detailreicher, also verwende ich die für die weiteren Berechnungen (die starke Abweichung bei den 0-4-Jährigen dürften auf eine erhöhte Dunkelziffer bei den Kleinkindern zurückzuführen sein):

Damit ergeben sich im Modell folgende Hospitalisierungs-Zahlen, die auch wieder ganz gut zu den vom RKI veröffentlichten Gesamtzahlen (schwarze Linie) passen:

Schritt 5: Berechnung der Belegung der Intensivstationen

Aus der Studie von Salje et al. habe ich mir die Rate der Patienten herausgesucht, die auf Intensiv mussten und diese mit der o.g. CHR multipliziert, und dann habe ich die Werte anhand der inzwischen verfügbaren offiziellen Altersdaten von den Intensivstationen korrigiert:

Damit können wir nun den Verlauf der Belegung der Intensivbetten berechnen (wobei ich als durchschnittliche Belegung 17 Tage verwende):

Wieder ein Cross-Check: Mein Modell zeichnet die offiziellen, historischen Zahlen der DIVI (schwarze Linie) aus der zweiten Welle mindestens gut genug nach.

Bemerkenswert erscheint mir, dass sich das Durchschnittsalter der ITS Patienten vor Juni nicht großartig ändert in meinen Modellberechnungen, die sehr gut die offiziellen Daten der DIVI nachzeichnen. Im Sommer sinkt das Durchschnittsalter aber dann klar ab.

Schritt 6: Berechnung der Anzahl der LongCovid-Patienten

Die Berechnung der Anzahl der LongCovid Patienten erfolgt nach den Daten der Studie Prevalence of ongoing symptoms following coronavirus (COVID-19) infection in the UK: 1 April 2021, die die folgende Angaben zur Wahrscheinlichkeit abgibt, dass ein Patient nach einem positiven Test noch Symptome hat. Diese Wahrscheinlichkeit liegt zwischen 12% und 21%, ich gehe aber nur maximal 180 Tage zurück, für längere Verläufe von LongCovid habe ich keine Daten gefunden. Die Dunkelziffer der nicht als positiver Fall verzeichneten Infizierten ist auch nicht berücksichtigt.

Damit ergibt sich eine immense Anzahl an LongCovid-Fällen:

Wie zuverlässig sind diese Daten?

Dass das Modell aus den Inzidenzen die Patientenzahlen usw. gut ableiten kann, haben wir oben im Vergleich zu DIVI und RKI Zahlen schon gesehen.

Die folgenden beiden Grafiken zeigen nun meine Modell-Ergebnisse für die ITS-Patienten im Vergleich zu den tatsächlichen ITS-Belegungen in Düsseldorf und Fürth. Wie man sieht sind die aus den historischen Inzidenzen berechneten ITS-Patientenzahlen sehr nahe an der Realität.

Wenn sich ein Mensch heute infiziert taucht er/sie i.d.R. erst in 7-10 Tagen in den Fallzahlen auf, und nochmal einige Tage später im Krankenhaus. Die Fälle/Patienten in 7-14 Tagen sind unausweichlich, eine Änderung an unserem Verhalten würde erst in 7-14 Tagen beginnen zu wirken.

Meine Hochrechnung der Fallzahlen dürfte – außer es findet ein harter Lockdown statt, das müsste man im Modell in der Reihe der R-Werte ergänzen – für mindestens 3 Wochen in die Zukunft gut genug sein, um damit die weitere Entwicklung auch in absoluten Zahlen gut abschätzen zu können.

Alles zusammen sind die Prognose Daten für die nächsten 4-5 Wochen als gute Näherung anzusehen, wobei – wie oben beschrieben – wir an vielen Stellen auf der optimistischen Seite bleiben, sodass ich ein Abweichen der Zahlen eher nach oben als nach unten erwarte.

Das Modell zum Ausprobieren

In meinem Artikel Spielerisch die Parameter der Pandemie-Mathematik verstehen – mit Prognosen für Deinen Landkreis! gibt es noch weitere Informationen zum Modell, ein Video und das Modell zum Ausprobieren.

Modelllauf vom 11.6.2021

Hier ist abschließend der komplette Modellauf, aus dem die oben gezeigten Daten kommen:

Zum Vergleich: Modelllauf vom 16.5.2021

Link zum Google Sheet

In meinem Artikel Spielerisch die Parameter der Pandemie-Mathematik verstehen – mit Prognosen für Deinen Landkreis! gibt es noch weitere Informationen zum Modell, ein Video und das Modell zum Ausprobieren.

Das aktuelle Google Sheet für Deutschland steht hier zum Kopieren zur Verfügung (benötigt ein Google Konto):

Version 10: https://docs.google.com/spreadsheets/d/1aQkYCacr7UK7d-uoJ48XyapPJVd33hQ6AVqvU_hRNfY/copy

Feedback bitte an: https://twitter.com/dpaessler

Änderungs-Historie

11.6.2021 – Version 10
  • Neu: Bessere Berücksichtigung von 1. und 2. Impfung mit jeweils spezifischer Wirksamkeit gegen Ansteckung und gegen schwere Verläufe (ITS/Tod)
  • Neu: Auch teilweiser Schutz durch Infektion berücksichtigt
  • Neu: R-Wert Anpassung nach Alter
  • Impfplan an aktuelle Daten angepasst, Impfung für U18 jetzt früher
  • Verbesserte Kalibrierung der Prognose anhand der hist. Daten
  • Viele kleine Anpassungen

Vorversionen: Siehe https://dirkpaessler.blog/2021/05/16/corona-pandemie-prognose-modell-v9/

Author: Dirk Paessler

CEO Carbon Drawdown Initiative -- VP Negative Emissions Platform -- Founder and Chairman Paessler AG

One thought on “Corona-Pandemie Prognose Modell V10”

Comments are closed.