Gesundheitsdaten: Datengold
Mit dem Schutz der Gesundheitsdaten ist das so eine Sache. Viele Leute arbeiten daran, einen europäischen Gesundheitsdatenmarkt zu etablieren. Damit soll der Rohstoff des Informationszeitalters, das „Datengold“, besser als bisher genutzt werden und dabei stört Datenschutz eher. Die Gesundheitspolitik sieht bei der Digitalisierung Aufholbedarf im internationalen Wettbewerb. Für was, ist etwas unklar. Von weltbewegenden therapeutischen Durchbrüchen hört man auch aus den Ländern, die angeblich so viel weiter als wir bei der Digitalisierung im Gesundheitswesen sind, doch recht wenig. Und in der Prävention braucht man nicht unbedingt mehr Daten, sondern mehr Taten. 10 Jahre Unterschied in der Lebenserwartung zwischen Arm und Reich, 120.000 vorzeitige Sterbefälle jährlich durch das Rauchen und 70.000 durch Alkohol mitbedingte Sterbefälle – solche Daten sollten eigentlich der Politik genug Stoff zum Handeln geben.
Aber zum Rohstoff werden Daten für die Wirtschaft nur, wenn daraus verkäufliche Produkte und Dienstleistungen gemacht werden können. Ein neues Krebsmedikament, das mit Hilfe von Big Data-Methoden ganz genau auf eine genetisch darauf ansprechende Patientengruppe ausgerichtet wurde, das lässt sich verkaufen. Das Krebsrisiko zu senken, indem man nicht raucht, sich ausreichend bewegt und nur mäßig trinkt – das klingt dagegen eher nach Spaßbremse. Geld verdienen lässt sich damit jedenfalls nicht viel.
Der Hype mit den schon von der Gentechnik oder der Hirnforschung bekannten Heilsversprechen ist eine Seite der aktuellen Datendebatte. Eine andere ist, dass die Gesundheitsforschung natürlich gute Daten braucht. Gute Daten bedeutet nicht immer mehr Daten. Wie der frühere deutsche Cochrane-Chef Gerd Antes vor kurzem bei einem Kongress sagte: Wenn der Heuhaufen nur größer wird, in dem man die Nadel suchen muss, wird Forschung nicht einfacher.
Datenschutz und Datenqualität
Manchmal geht es aber auch essentiell um mehr Daten, und paradoxerweise gerade dort, wo Daten gut geschützt werden. Datenschutz macht dann mitunter die Nutzung von Daten unmöglich oder erschwert sie zumindest erheblich. Ein Beispiel sind die 2016 veränderten Geheimhaltungsregeln in der amtlichen Todesursachenstatistik. Niemand will, dass Daten der amtlichen Statistik deanonymisiert werden können, dass also z.B. ein HIV-Sterbefall anhand von Alter, Geschlecht und Wohnort namentlich identifiziert werden kann. Daher achten die Statistischen Ämter darauf, dass die ausgewiesenen Fallzahlen bei bestimmten Merkmalskombinationen nicht zu klein werden. Seit 2016 tun sie das besonders akribisch. Das führt dazu, dass lange geltende Grundsätze der amtlichen Statistik hinterrücks hinfällig werden. In den Qualitätsstandards der Statistischen Ämter des Bundes und der Länder hieß es beispielsweise vor gut 10 Jahren noch:
„Oberste Maxime bei der Erstellung und Weiterentwicklung statistischer Informationen ist die Erfüllung der Anforderungen der Nutzer. Die Nutzer sollen die Informationen erhalten, die sie für ihre Zwecke benötigen.“
Das gilt insbesondere auch für die Politik:
„Durch die rasche Bereitstellung von qualitativ hochwertigen Daten werden Entscheidungsträger in Politik, Wirtschaft und Verwaltung in die Lage versetzt, schneller auf Änderungen externer Rahmenbedingungen zu reagieren.“
Dazu müssen die Daten natürlich stimmen:
„Statistiken sollen die Realität möglichst genau und zuverlässig widerspiegeln.“
Nur können sie eine auch im Gesundheitsbereich unerlässliche Funktion erfüllen:
„Statistische Ergebnisse sollen zuverlässige zeitliche, räumliche und fachliche Vergleiche ermöglichen.“
Dabei ist aber zugleich, wie gesagt, den höchsten Anforderungen im Datenschutz zu genügen. In der Todesursachenstatistik scheint man versucht zu haben, das über die Quadratur des Kreises zu erreichen.
Datengold oder Datenblech?
Die amtliche Statistik weist z.B. die Suizide nach Regierungsbezirken aus. In Bayern liefert das diese Tabelle:
Zählt man die Suizide für die sieben Regierungsbezirke Bayerns zusammen, ergibt das 1.543 Suizide. Für das Land werden aber insgesamt 1.738 Suizide ausgewiesen, also 195 Suizide mehr. Der Unterschied sind Geheimhaltungsfälle. Mehr als 10 % der Suizide in Bayern werden also auf der Ebene der Regierungsbezirke aus Geheimhaltungsgründen umkodiert in R99-Fälle. Das macht sich besonders bei den jüngeren Altersgruppen bemerkbar. Dort fehlt auf Regierungsbezirksebene in manchen Altersgruppen mehr als die Hälfte. Geht man weiter auf die Kreisebene, verschärft sich die Problematik bei sehr kleinen Fallzahlen noch einmal. Das ist kein bayerisches Problem, es ist ein bundesweites, die Todesursachenstatistik ist eine Bundesstatistik. Es ist auch nicht nur ein Problem der Suizide, sondern betrifft alle Todesursachen mit kleineren Fallzahlen.
Eine solche Geheimhaltung macht den Sinn der amtlichen Statistik teilweise zunichte. Wie sollen Gesundheitsämter oder andere kommunale Stellen noch beurteilen können, ob bei ihnen die Suizide abnehmen oder ob es nur mehr Geheimhaltungsfälle gab, ob sie mehr oder weniger Suizide als der Nachbarlandkreis haben und woran das liegen könnte – oder ob sie nur mehr oder weniger Geheimhaltungsfälle haben? Oder was ist dann von Zeitungsberichten zu halten, die regionale Suizidzahlen aus der amtlichen Statistik berichten, aber vermutlich nichts von diesen Geheimhaltungsverfahren wissen?
Seit vielen Jahren bemüht man sich darum, die nicht sehr gute Qualität der ärztlichen Todesbescheinigungen zu verbessern. Im Dezember erscheint dazu ein Schwerpunktheft des Bundesgesundheitsblatts, das Editorial ist schon online. Man darf sich fragen wozu, wenn jeder Qualitätsgewinn am Anfang der Datenkette am Ende derselben durch die Geheimhaltung wieder einkassiert wird. Aus Datengold wird so Datenblech, der Datenschutz zu einer Art umgekehrter Alchimie. Das muss doch im Zeitalter der Digitalisierung besser hinzukriegen sein! Herr Spahn?
————–
Ergänzung 12.8.2023:
In der Todesursachenstatistik wird künftig nicht mehr nach R99 umkodiert oder mit Zellsperrungen gearbeitet, sondern problematische Zellbesetzungen werden stochastisch überlagert. Am Beispiel aus dem Blog: Die Suizide eines Landkreises werden in der Summe korrekt erhalten, aber die Altersgliederung stimmt womöglich nur noch in statistischer Annäherung. Inwiefern die so bearbeiteten Daten noch eine halbwegs verlässliche Altersstandardisierung erlauben, muss man sehen, und prüfen.
Kommentare (17)