Update: Hier geht es zur nächsten Version 10 des Modells.
Seit Mitte Februar entwickle ich ein vereinfachtes mathematisches Modell mit dem Ziel, den weiteren Pandemie-Verlauf in Deutschland für einige Wochen in die Zukunft mit brauchbarer Genauigkeit abzuschätzen, zumindest soweit das Verhalten der Bevölkerung und/oder die sich ändernden Maßnahmen der Regierung abzusehen sind.
Auch ein Ausblick auf mehrere Monate ist machbar, die Ergebnisse werden aber natürlich ab 4-6 Wochen zunehmend unschärfer und können nur zum qualitativen Vergleich verschiedener Szenarien dienen, wenn man z.B. verschiedenen Maßnahmen odr den Einfluss neuer Mutationen simuliert.
Im Folgenden möchte ich die aktualisierte Version vorstellen (Änderungen zu Vorversionen siehe unten in der Änderungs-Historie).
Es gibt auch ein Video mit Live-Vorstellung des Modells (Video zeigt Version 8 vom 26.4.2021).
Warum wir Modelle zum Planen brauchen
Für den gesellschaftlichen Diskurs über die Lockerung oder Verschärfung von Maßnahmen erscheint es mir wichtig, dass man verschiedene Strategien im Umgang mit der Pandemie durchspielen und die unterschiedlichen Folgen vergleichen kann.
Denn was uns klar sein sollte: Für exponentielle Wachstums-Prozesse haben wir Menschen in der Regel kein gute spontane Einschätzung. Die meisten von uns bekommen lineare Entwicklungen ganz gut hin, aber Wachstumsprozesse mit kurzen Verdopplungszeiten für 2-3 Monate in die Zukunft korrekt abzuschätzen ist wirklich schwer.
Ziel: Das Jedermann-Modell
Das folgende Modell ist ein sehr vereinfachter Ansatz und ersetzt keinesfalls die hochaufwendigen und komplexen Modelle der Epidemiologen. Meine Zielsetzung ist: Das Modell soll möglichst so einfach sein, dass jeder interessierte Laie sich einlesen kann und den Berechnungsweg nachvollziehen kann. Damit kann sich der Betrachter sein persönliches Bild machen und zu einer eigenen Einschätzung kommen, ob er den Ergebnissen traut, oder nicht.
Dies ist also ein Debattenbeitrag und ich freue mich über jeden, der mich auf Fehler, falsche Annahmen oder Verbesserungsmöglichkeiten hinweist. Ich bitte um Kommentare, Kritik, Verbesserungsvorschläge. Die Google Sheet Datei ist öffentlich einsehbar (Link am Ende des Artikels).
Soweit möglich vergleiche ich meine Modellberechnungen immer wieder mit anderen Quellen und anderen Prognosen und verbessere das Modell ständig.
Die Grundidee des Modells
Die Grundlage für alle Folge-Berechnungen ist die Berechnung der Fallzahlen für die Zukunft. Mein Modell teilt dafür die Bevölkerung in 5-Jahres-Altersgruppen auf und rechnet für jede Altersgruppe ausgehend von deren Inzidenz von letzter Woche die neue Inzidenz der Folgewoche.
Bei den Berechnungen wende ich einige Vereinfachungen an, die zwar eine gewissen Unsicherheit mit sich bringen, im Rahmen eines exponentiellen Wachstums aber von untergeordnetem Einfluss sein dürften.
Insgesamt ist mein Ziel ein tendenziell optimistisches Modell zu bauen, eine Überdramatisierung bringt uns nichts, wenn doch schon die optimistischen Szenarien unerträglich erscheinen. Wenn die Zahlen eskalieren wird sich auch das Verhalten der Bürger ändern und als Bremse fungieren, was schwer zu berechnen ist.
Angenommene Schlüsselzahlen und Vereinfachungen
- 50-20% der Infektionen finden in der gleichen Altersgruppe statt, der Rest wird aus den anderen Altersgruppen eingetragen (Herleitung, Quelle).
- Wenn in einer Altersgruppe 80% der Menschen geimpft sind oder infiziert waren, gibt es keine weiteren Neuinfektionen innerhalb dieser Gruppe (“Herdenimmunität”).
- Die erste Impfung vermeidet 30% der Neuansteckungen, 14 Tage nach der zweiten Impfung wird eine Ansteckung zu 90% verhindert (Quelle).
- Die erste Impfung vermeidet 50% der schweren Verläufe (=Klinik/ICU/Tod), 14 Tage nach der zweiten Impfung werden schwere Verläufe zu >95% verhindert (Quelle).
- In allen Altersgruppen erfolgen die Ansteckungen mit dem gleichen R-Wert (beschleunigtes Wachstum z.B. in offene/geschlossene Schulen durch Präsenz wird nicht extra berücksichtigt)
- Bis August werden alle Impfwilligen Erwachsenen 2x geimpft, ab August gibt es Impfungen für die Gruppe 12-16, ab November für die U12.
- Nicht berücksichtigt: Weil in der zweiten Welle die Patienten jünger sind, ist zu erwarten, dass die durchschnittliche Behandlungszeit in der Intensivstation länger ist (die älteren sterben schneller), was die Belegungszahlen ggf. steigen lässt.
- Nicht berücksichtigt ist, dass es bei sehr hoher Belastung der Kliniken und der Rettungssysteme zu höheren Sterberaten kommt.
Schritt 1: Berechnung der wöchentlichen Fallzahlen
Ich gehe von den wöchentlich verfügbaren RKI-Altersgruppen-Inzidenz-Daten aus und rechne dann jede weitere Woche iterativ weiter. Dafür berechne jede Iteration drei mal: mit R-Werten für den Wild-Typ (der im Mai 2021 fast schon komplett verdrängt wurde), für B.1.1.7 und zusätzlich kann eine Mutation wie B.1.617.2 ab Mai hinzugenommen werden.
Aus einem RWild, dem R-Wert des Wildtyps für den wir Erfahrungswerte aus 2020 haben (welche Maßnahmen/Verhaltensweisen erzeugen welchen RWild-Wert?) berechne ich die R-Werte für B.1.1.7 ( RWild + 0,35) und B.1.617.2 (RWild +x). Schätzwerte für RWild sind z.B.: November 2020= 1,0; März 2021=1,1; Oktober 2020=1,3).
Die Formel für die Berechnung einer Alters-Inzidenz für eine Woche lautet:

t | die Kalender-Woche |
nAlter(t) | Inzidenz je Kalenderwoche für eine Altersgruppe |
nAlle(t) | Inzidenz je Kalenderwoche für alle Altersgruppen |
R7-Tage | Der 7-Tage R-Wert (z.B. im Februar war RWildtyp=0,85, RMutationen=RWildtyp +0,35) |
iHerde | Herdenimmunität (ich verwende hier 80%) |
qAlter(t-2) | Impfquote für eine Altersgruppe (Annahmen zur Impfwirkung der 1. und 2. Impfung s.o.) |
kSaison | Saisonalität zwischen 100% (Winter) und 80% (Sommer), Sinuskurve von April bis September |
kMassnahmen | Absenkung der Ansteckung durch z.B. Schnelltests |
7/4 | Der 7/4 Exponent rechnet die R-Wirkung von 4 Tage Zykluszeit auf eine Woche um |
0,3/0,7 | Der Eintragungsfaktor wird wie o.g. nach Alter verwendet |
Alles was wir nun noch brauchen, um die Inzidenzen zu berechnen sinde R7-Tage für jede Woche des zu modellierenden Zeitraums – bei mir ausgedrückt in RWild. Die Reihe der RWild-Werten müssen wir aus den zu erwartenden Verhaltensänderungen ableiten. Zum Beispiel hatten wir Mitte Januar durch die Lockdown-Maßnahmen einen RWild-Wert von ca. 0,85. Aus diesem berechnet mein Modell dann den RMutation-Wert für die Mutation B.1.1.7, der +0,35 höher liegt. Ab Mai kann eine weitere Mutation gerechnet werden mit wiederum eigener Eingabe für die R-Wert Erhöhung.
Schritt 2: Modellierung des Impf-Fortschritts
Neben der o.g. Abfolge der wöchentlichen R-Werte ist der Impffortschritt die Quelle der größten Unsicherheit im Modell, wenn man um mehr als 4-6 Wochen in die Zukunft schaut.
Leider stehen in Deutschland z.Zt. keine Zeitverlaufsdaten der Impfraten der Altersgruppen zur Verfügung. Mein “Impfplan” beruht daher historisch auf Basis der aktuellen Impfdaten (lt. www.zeit.de).

In der Zukunft gehe ich von der Annahme aus, dass ab Mitte April 2,5 Mio Erstimpfungen pro Woche erfolgen, dass wir ab August die 12-16 jährigen impfen und ab 1.11. auch alle unter 12 Jahren.

Die höchste zu erwartende Impfquote pro Altersgruppe habe ich aus der Studie “ECOS survey 6th wave” des Hamburg Center for Health Economics übernommen. Damit ergibt sich folgender Impfplan:

Damit ergibt sich aktuell (16.5.2021) in den nächsten Wochen mit Bundes-Notbremse und sonst keinen Änderungen an unserem Verhalten bzw. den Maßnahmen (weder Lockerungen noch Verschärfungen) und ohne Auftreten von Mutationen folgender Verlauf der Fallzahlen:

Schritt 3: Berechnung der Todesfälle
Aus den Fallzahlen und deren Altersstruktur können wir jetzt die Todesfälle für jede Woche und jede Altersgruppe berechnen. Die Verstorbenen pro Fall (“Case Fatality Rate”) kann ich mir mit “Todesfälle mit Coronavirus (COVID-19) in Deutschland nach Alter und Geschlecht” aus dem RKI Bericht berechnen.
Entscheidend ist hierbei, dass die Sterberaten natürlich bei den Ü80 ganz besonders hoch liegen, aber auch bei 40-70-Jährigen gibt es ein Sterberisiko, das klar größer null ist:

Im Falle eines Durchlaufens der Infektion durch die gesamte, ungeimpfte Bevölkerung würden sich theoretisch folgende Zahlen an Verstorbenen ergeben (wären nur alle über 50 geimpft, wären es fast 16.000 mögliche Opfer):

Damit kann mein Modell nun die Zahl der Verstorbenen der zweite Welle vom RKI (schwarze Linie) schon gut “nachzeichnen” (für die erst kürzlich vergangenen Wochen sind die RKI Daten immer unvollständig!):

Das RKI gibt zwei unterschiedliche Zeitreihen für die Todesfälle heraus (1,2), die hier beide dargestellt sind im Vergleich zu meiner Modellrechnung. Eine erste Überprüfung des Modells ist also erfolgreich.
Schritt 4: Berechnungen der stationären Aufnahmen (“Hospitalisierungen”)
Erst seit kurzem gibt das RKI wöchentlich Daten zur Altersstruktur der Hospitalisierungen heraus, mit denen man eine “Case Hospitalization Rate” berechnen kann.

Wie man sieht verlaufen diese Raten von November bis Mitte Januar (2. Welle) ziemlich konstant, das dürften also brauchbare Werte sein. Davor gab es wenige Fälle (ungenau durch kleine Losgröße) und ab Februar verändern sie sich drastisch, das dürften statistische Verschiebungen durch die Impfungen sein. Auch Veränderungen in den Dunkelziffern über die Zeit dürften hier reinspielen. Die Werte der letzten 2 Wochen sind unvollständig.
Wenn man die Mittelwerte von November bis Februar vergleicht mit den Daten des Covid-Pandemic-Mortality-Risk-Estimator des “The Economist”, dann sieht man, dass die gut zusammenpassen, die Economist Daten sind aber detailreicher, also verwende ich die für die weiteren Berechnungen (die starke Abweichung bei den 0-4-Jährigen dürften auf eine erhöhte Dunkelziffer bei den Kleinkindern zurückzuführen sein):

Damit ergeben sich im Modell folgende Hospitalisierungs-Zahlen, die auch wieder ganz gut zu den vom RKI veröffentlichten Gesamtzahlen (schwarze Linie) passen:

In den letzten 4 Wochen werden noch Nachmeldungen kommen, dann geht die schwarze Linie auch noch nach oben, wie meine Zahlen.
Schritt 5: Berechnung der Belegung der Intensivstationen
Aus der Studie von Salje et al. habe ich mir die Rate der Patienten herausgesucht, die auf Intensiv mussten und diese mit der o.g. CHR multipliziert, und dann habe ich die Werte anhand der inzwischen verfügbaren offiziellen Altersdaten von den Intensivstationen korrigiert:

Damit können wir nun den Verlauf der Belegung der Intensivbetten berechnen (wobei ich als durchschnittliche Belegung 17 Tage verwende):

Wieder ein Cross-Check: Mein Modell zeichnet die offiziellen, historischen Zahlen der DIVI aus der zweiten Welle mindestens gut genug nach.
Bemerkenswert erscheint mir, dass sich das Durchschnittsalter der ITS Patienten vor Juni nicht großartig ändert in meinen Modellberechnungen, die sehr gut die offiziellen Datend der DIVI nachzeichnen. Im Sommer sinkt das Durchschnittsalter aber dann klar ab.

Schritt 6: Berechnung der Anzahl der LongCovid-Patienten
Die Berechnung der Anzahl der LongCovid Patienten erfolgt nach den Daten der Studie Prevalence of ongoing symptoms following coronavirus (COVID-19) infection in the UK: 1 April 2021, die die folgende Angaben zur Wahrscheinlichkeit abgibt, dass ein Patient nach einem positiven Test noch Symptome hat. Diese Wahrscheinlichkeit liegt zwischen 12% und 21%, ich gehe aber nur maximal 180 Tage zurück, für längere Verläufe von LongCovid habe ich keine Daten gefunden. Die Dunkelziffer der nicht als positiver Fall verzeichneten Infizierten ist auch nicht berücksichtigt.

Damit ergibt sich eine immense Anzahl an LongCovid-Fällen:

Wie zuverlässig sind diese Daten?
Dass das Modell aus den Inzidenzen die Patientenzahlen usw. gut ableiten kann, haben wir oben im Vergleich zu DIVI und RKI Zahlen schon gesehen.
Die folgenden beiden Grafiken zeigen nun meine Modell-Ergebnisse für die ITS-Patienten im Vergleich zu den tatsächlichen ITS-Belegungen in Düsseldorf und Fürth. Wie man sieht sind die aus den historischen Inzidenzen berechneten ITS-Patientenzahlen sehr nahe an der Realität.


Wenn sich ein Mensch heute infiziert taucht er/sie i.d.R. erst in 7-10 Tagen in den Fallzahlen auf, und nochmal einige Tage später im Krankenhaus. Die Fälle/Patienten in 7-14 Tagen sind unausweichlich, eine Änderung an unserem Verhalten würde erst in 7-14 Tagen beginnen zu wirken.
Meine Hochrechnung der Fallzahlen dürfte – außer es findet ein harter Lockdown statt, das müsste man im Modell in der Reihe der R-Werte ergänzen – für mindestens 3 Wochen in die Zukunft gut genug sein, um damit die weitere Entwicklung auch in absoluten Zahlen gut abschätzen zu können.
Alles zusammen sind die Prognose Daten für die nächsten 4-5 Wochen als gute Näherung anzusehen, wobei – wie oben beschrieben – wir an vielen Stellen auf der optimistischen Seite bleiben, sodass ich ein Abweichen der Zahlen eher nach oben als nach unten erwarte.
Das Modell zum Ausprobieren
In meinem Artikel Spielerisch die Parameter der Pandemie-Mathematik verstehen – mit Prognosen für Deinen Landkreis! gibt es noch weitere Informationen zum Modell, ein Video und das Modell zum Ausprobieren.
Modelllauf vom 16.5.2021:
Hier ist abschließend der komplette Modellauf, aus dem die oben gezeigten Daten kommen:
Link zum Google Sheet
In meinem Artikel Spielerisch die Parameter der Pandemie-Mathematik verstehen – mit Prognosen für Deinen Landkreis! gibt es noch weitere Informationen zum Modell, ein Video und das Modell zum Ausprobieren.
Das aktuelle Google Sheet für Deutschland steht hier zur Verfügung:
Version 9: https://docs.google.com/spreadsheets/d/13DhMByt2veGpGgpOO0Q64Nry7pW1qLASpBM7UFRMqxI/copy
Feedback bitte an: https://twitter.com/dpaessler
Änderungs-Historie
16.5.2021 – Version 9
- Neu: Bessere Berücksichtigung von 1. und 2. Impfung mit jeweils spezifischer Wirksamkeit gegen Ansteckung und gegen schwere Verläufe (ITS/Tod)
- Neu: Altersverteilung ITS Patienten anhand von RKI Daten korrigiert
- Viele kleine Anpassungen
Vorversionen: Siehe hier.
One thought on “Corona-Pandemie Prognose Modell V9”
Comments are closed.