Beitragsreihe „Input Control – Datenqualität und Datenvalidität als Grundlage rechtlicher Automatisierungsprozesse“, Abschnitt „Input“
7. Mai 2020

ISSN 2699-8084

Wissenschaftlicher Artikel
Datenrecht
Lesezeit 15 Min.
Prof. Dr. Matthias Rossi
Inhaber des Lehrstuhls für Staats- und Verwaltungsrecht, Europarecht sowie Gesetzgebungslehre | Universität Augsburg

Jede rechtliche Entscheidung ist nur so gut wie die Qualität der Tatsachen, auf denen sie beruht. Das gilt für von Menschen getroffene – fast möchte man sagen: humane – Entscheidungen, und es gilt noch mehr für automatisch generierte Entscheidungen. Denn der Mensch ist eben nicht nur potenzieller Fehlerfaktor, sondern auch möglicher Fehlerfinder: Seine Erfahrung und sein Misstrauen können Informationen in Frage stellen, die sich digital nur neutral als Einsen oder Nullen darstellen. Zwar besteht im Jahre 2020 kein Zweifel mehr daran, dass KI-gestützte Systeme sich und also auch die ihnen eingespeisten Daten selbst hinterfragen können. Doch wo Menschen einen Mangel an Erfahrung durch ein Mehr an Vorstellungskraft ausgleichen können, können Maschinen die Qualität von Informationen derzeit nur bei deren hinreichender Quantität und auch dann nur mit einer gewissen Wahrscheinlichkeit bemessen. Um so verständlicher ist es, dass gerade mit Blick auf konkrete Anwendungsfelder rechtlicher Automatisierung als Qualitätssicherung mehr Klasse statt Masse gefordert wird und damit zugleich die Hoffnung einhergeht, durch eine effektive „input control“- auf aufwändige „output control“-Maßnahmen verzichten zu können. Welche Rolle also kann, welche sollte und welche muss der Staat bei der Sicherung von Datenqualität und -validität als Grundlage rechtlicher Automatisierungsprozesse spielen? Drei kurze Beispiele aus unterschiedlichsten Regelungsbereichen zeigen, dass der Staat unterschiedliche Rollen einnehmen kann.

 

 

Vorbemerkungen

 

Informationen – Daten – Phänomene

Zunächst müssen begriffliche Unsicherheiten und Ungenauigkeiten offengelegt werden. Mag man sich auch daran gewöhnt haben, dass die Begriffe Datum und Information immer häufiger synonym verwendet werden, so ist es für rechtliche Automatisierungsprozesse doch von besonderer Bedeutung, nicht nur und erst zwischen dem bloßen Datum und seiner Bewertung zu unterscheiden, sondern bereits zuvor zwischen dem Datum und dem Phänomen, das es beschreiben soll. Ob 99 Handys, die sich ausweislich ihrer Ortung langsam über eine Straße bewegen, einen Stau oder nur den normalen Berufsverkehr indizieren, ist eine Frage der Bewertung, die ort- und zeitabhängig unterschiedlich ausfallen wird. Dass sie aber womöglich gar nicht 99 einzelnen Pkw, sondern nur einem einzigen Kinderwagen zuzuordnen sind, wie es in einer Aufsehen erregenden Kunstaktion Anfang 2020 der Fall war, illustriert, dass auch zwischen den erhobenen Daten und dem eigentlichen Phänomen zu differenzieren ist. „Misstraue dem Datum!“, ist insofern die Erkenntnis des Experiments, die auch bei der Ausgestaltung rechtlicher Automatisierungsprozesse berücksichtigt werden sollte.

 

Relativität von Qualität

„Misstraue der Qualität, misstraue schon Qualitätsstandards!“, sind weitere Maximen, die es sich bewusst zu machen gilt. Denn allgemeine Qualitätskriterien für staatliche Informationen ließen sich nur mit einer ebenso allgemeinen (und also geringen) Aussagekraft benennen. Es ist zwar nicht falsch, wenn staatliche Daten grundsätzlich an denselben Qualitätsparameter gemessen werden, die ganz generell für „Big Data“ gelten: Aktualität, Konsistenz, Genauigkeit, Richtigkeit und Vollständigkeit sind sicherlich Beispiele für Kernaspekte einer Datenqualität. Doch abgesehen davon, dass auch diese Begriffe im Einzelnen auslegungsfähig und definitionsbedürftig sind, bestimmen sich die Anforderungen an die Qualität von Daten immer nach dem konkreten Zweck, zu dem sie verwendet werden sollen. Neutralität, Sachlichkeit und diskriminierungsfreie Zugänglichkeit sind insoweit weitere Qualitätskriterien, die für staatliche Informationen von Bedeutung sein können. Kurzum: Die Qualität von Daten ist kein absoluter, sondern ein relativer Maßstab, der sich nach dem jeweiligen Verwendungszweck und vor allem auch nach der konkreten Anwendung bestimmt.

 

Inkongruente Qualitätsanforderungen an Erhebung und Verwendung

Wegen des Zusammenhangs zwischen der Qualität von Daten und der Intentionalität ihrer Verwendung gibt es auch keine vollständige Kongruenz zwischen den Qualitätsanforderungen an die Datenerhebung einerseits und an die Datenverwendung andererseits. Nur bei einer strikten Zweckbindung zwischen Datenerhebung und Datenverarbeitung sind die Qualitätsanforderungen weitgehend deckungsgleich. Doch wenn Zweck der Datenerhebung und Ziel ihrer Verwendung auseinanderfallen, können sich die Qualitätsanforderungen ganz erheblich unterscheiden.

 


Informationsfreiheitsrecht: Fundgrube statt Fachhandel

Sollen staatliche Daten als Grundlage rechtlicher Automatisierungsprozesse fungieren, genügt es deshalb in aller Regel nicht, auf solche Daten zurückzugreifen, die mehr oder minder zufällig bei staatlichen Stellen vorhanden sind. Damit ist das erste Beispiel angesprochen: Das gesamte Informationsfreiheitsrecht, das in all seinen sachlichen und regionalen Ausdifferenzierungen auf die freie Verfügbarkeit solcher Informationen zielt, die beim Staat vorhanden sind, bietet im Ergebnis nur Rohmaterial, nicht aber qualitativ wertvolle Informationen.

 

Freie Zugänglichkeit ohne Qualitätsgarantie

Ganz im Gegenteil: Jenseits des Zwecks, zu dem die Daten erhoben wurden, traut der Staat seinen eigenen Daten nicht. Vielmehr schließt er die Gewähr für die inhaltliche Richtigkeit explizit aus. Dies mag auf den ersten Blick verwundern, ist aber durchaus konsequent. Denn die über das Informationsfreiheitsrecht zugänglichen Daten sind bei Lichte betrachtet nur als Nebenprodukte bei der Erfüllung anderer Aufgaben angefallen – etwa im Rahmen einer Eröffnungs- oder einer laufenden Kontrolle oder im Zusammenhang mit der planenden Verwaltungstätigkeit. Die Stellen generieren und archivieren Daten nur nach ihren eigenen spezifischen Bedürfnissen und nach den Regeln der Aktenführung, nicht hingegen nach etwaigen und im Vorhinein ja auch in ihrer Vielfalt nicht vorhersehbaren Wünschen potentieller Nutzer des Informationsfreiheitsrechts.

 

Dementsprechend distanzieren sich sowohl die allgemeinen Informationsfreiheitsgesetze als etwa das Verbraucherinformationsgesetz oder auch das E-Government-Gesetz bewusst von der Richtigkeit, Vollständigkeit oder Plausibilität der zugänglichen Informationen. Die „Beweiskraft“ im Informationsfreiheitsrecht bezieht sich insofern grundsätzlich immer nur auf die bloße Existenz von Informationen, nicht auf deren Inhalt. Um die Validität solcher zweckunabhängig bereitgestellten staatlichen Daten steht es deshalb nicht gut. Diese Daten sind eher rückwärtsgewandt – sie geben Aufschluss darüber, was eine staatliche Stelle zu einem bestimmten Zeitpunkt in der Vergangenheit wusste bzw. hätte wissen können, entfalten darüber hinaus aber kaum eine Aussage- geschweige denn eine Vorhersagekraft.

 

Aktualität als Achillesferse

Ursächlich für die schlechte Qualität von Informationen, die im Rahmen der staatlichen Tätigkeit quasi als Nebenprodukt anfallen, ist die zeitliche Komponente: Zu einer Überprüfung der Aktualität (und mit ihr also der inhaltliche Richtigkeit) von Daten ist der Staat regelmäßig nicht verpflichtet. Das Umweltinformationsrecht normiert zwar noch die Obliegenheit, die Umweltinformationen nach Möglichkeit zu aktualisieren, doch bewirkt dies nicht, das sämtliche bereitgestellten Umweltinformationen jedenfalls zum Zeitpunkt ihrer Bereitstellung aktuell wären.

 


Anlassbezogene aktive staatliche Unterrichtung

Auch das gerade vom Bundestag beschlossene Geologiedatengesetz schließt eine Haftung für die Aktualität, Vollständigkeit und Richtigkeit der öffentlich bereitgestellten geologischen Daten aus. Überzeugend ist dies nur bedingt. Denn abgesehen davon, dass es sich bei geologischen Daten in aller Regel um recht beständige Informationen handeln wird, sieht das Geologiedatengesetz strukturell nicht eine individuelle Informationsgewährung auf Antrag, sondern eine generelle Publikation von Amts wegen vor. Damit ist ein zweites Regelungsfeld angesprochen – die aktive staatliche Unterrichtung.

 

Verpflichtung auf inhaltliche Richtigkeit

Informiert der Staat nämlich von sich aus aktiv die Öffentlichkeit, so trifft ihn nach der Rechtsprechung des Bundesverfassungsgerichts grundsätzliche eine Verpflichtung zur Richtigkeit, Vollständigkeit und Sachlichkeit.[1] Nur die Verbreitung richtiger Informationen ist nämlich zur Erreichung ihres Zwecks geeignet. Dementsprechend ist der Staat in diesen Fällen auch zur Richtigstellung verpflichtet, wenn sich zunächst publizierte Informationen als falsch erweisen.

 

Unmittelbarkeit oder Adressatenkreis als Differenzierungskriterium?

Doch kann es einen Unterschied machen, ob der Staat von sich aus aktiv unterrichtend tätig wird oder Informationen nur passiv bereithält? Ob die Öffentlichkeit also unmittelbar vom Staat oder nur mittelbar über einen Privaten informiert wird? Oder ist diese Differenzierung nicht verallgemeinerungsfähig, weil sie die notwendige Informationsqualität letztlich nicht an die Rolle des Staates, sondern an die Größe des Adressatenkreises anknüpft? So jedenfalls versteht das Bundesverwaltungsgericht die verfassungsrechtlichen Vorgaben und meint, dass sich eine aktive Unterrichtung der gesamten Öffentlichkeit von der Preisgabe einer Information an einen individuellen Antragsteller auch dann unterscheidet, wenn diese die Information seinerseits publik macht.[2]

 


Laufende staatliche Datenerhebung und -preisgabe

Ein dritter Regelungsbereich betrifft die permanente staatliche Datenerhebung und -preisgabe und nähert sich insofern dem Bereich an, der wie etwa die Telematik auf die Datenverarbeitung in Echtzeit zielt: Wetterdaten.

 

Kapitulation vor dem Ungewissen

Die Wetterprognose ist in Deutschland – ähnlich wie etwa der Rundfunk – dual ausgestaltet: Neben dem Deutschen Wetterdienst haben sich verschiedene private Wetterdienstleister am Markt etabliert, die sämtlich meteorologische und klimatologische Dienstleistungen erbringen. Der DWD ist darüber hinaus für amtliche Warnmeldungen zuständig, die ihrerseits von weitreichender wirtschaftlicher und persönlicher Bedeutung sein können. Solche Wetterdaten sind naturgemäß dynamischer Natur – sie verändern sich in kürzester Zeit, im Zweifel gar sekündlich. Dementsprechend hoch sind die Anforderungen an die Informationsqualität. Der DWD hat sich deshalb zwar selbst einem zertifizierten Qualitätsmanagementsystem unterworfen, haftet aber nach überwiegender Meinung weder direkt noch über einen Amtshaftungsanspruch für die Folgen fehlerhafter Prognosen: „Bei Wetterberatungen und Prognosen kann ein Abweichen des eingetretenen vom vorhergesagten Wetter nicht vollständig ausgeschlossen werden und ist kein Mangel.“, lautet der Disclaimer in den AGB des DWD.

 

Kann dies eine Lösung für rechtliche Automatisierungsprozesse sein? Ein Disclaimer für das Abweichen des tatsächlichen vom errechneten Sachverhalt, an den sich unterschiedliche Rechtsfolgen knüpfen? Ungeachtet vieler Detailfragen doch sicherlich nur, wenn es Ausweichstrategien gibt, wenn es im jeweiligen Regelungsbereich – der Telematik etwa – Möglichkeiten gibt, auf die angebotene Technik zu verzichten.

 

Parallelität von staatlichen und privaten Datenanbietern

Doch ungeachtet dieser schwierigen Frage ist das Wetter aus anderem Grunde ein gutes Beispiel für die Frage, welche Informationsgewährungspflichten den Staat treffen. Denn hier stehen ein staatlicher Anbieter und verschiedene private Dienstleister im Wettbewerb zueinander, und dieser Wettbewerb sorgt aus Nutzerperspektive letztlich für eine systemübergreifende Redundanz, die ihrerseits ein besonderes Qualitätssicherungsmerkmal ist. Ist eine solche Parallelität von staatlichen und privaten Dienstleistern also ein probates Beispiel für andere Regelungsbereiche? Verheißt das Nebeneinander von „amtlichen“ (also jedenfalls gefühlt richtigen) und im Wettbewerb erzeugten Daten eine Datenqualität, die für rechtliche Automatisierungsprozesse hinreichend ist?

 


Zusammenspiel staatlicher und privater Informationsgewährung

Damit ist die Frage angesprochen, wie eine sinnvolle Arbeitsteilung zwischen einer staatlichen und privaten Informationsgewährleistung ausgestaltet sein kann.

 

Fünf Grundmodelle

Wenn man im Grundsatz davon ausgeht, dass rechtliche Automatisierungsprozesse nicht auf einem zufällig vorgefundenen Datenbestand aufbauen können, sondern gezielt für den Zweck der jeweiligen Automatisierung erhobene Daten voraussetzen, dann ergeben sich daraus für die Aufgabenverteilung zwischen staatlichen und privaten Informationsgewährungspflichten insgesamt fünf Grundmodelle: Zwei in sich abgeschlossene und eigenständige Modelle, bei denen die Informationserhebung und -gewährung entweder ausschließlich in staatlicher bzw. privater Hand liegen, (mindestens) zwei Mischformen, bei denen die Datenbasis von der einen Ebene zur Verfügung gestellt und von der anderen Ebene aufbereitet wird, sowie ein Modell des unverbundenen Nebeneinander. Welches dieser Modelle für den jeweiligen Anwendungsbereich praktiziert wird, ist verfassungsrechtlich kaum determiniert, rechtlich aber natürlich determinierbar.

 

Offene Entscheidung

Welche Aufgaben von allgemeinem Interesse zwingend durch den Staat und welche (vielleicht sogar besser) durch Private erbracht werden können, ist in den weiten Grenzen der offenen Wirtschaftsverfassung und selbst in den engeren Grenzen der Unionsverträge im Prinzip eine politische Entscheidung der jeweiligen demokratischen Mehrheit. Die Dauerdiskussion über die Bestimmung der Staatsaufgaben und über die Staatsaufgabenkritik soll und muss in Bezug auf die Frage rechtlicher Automatisierungsprozesse nicht wiederholt werden, jedenfalls nicht auf prinzipieller oder theoretischer Ebene. Grundrechtliche Schutzpflichten oder der Begriff der Daseinsvorsorge sind für sich genommen ebenso wenig Argumente wie der innovationsschaffende Wettbewerb oder die invisible hands von Adam Smith. Vielmehr ist für jeden Anwendungsbereich gesondert zu betrachten, wie die für einen rechtlichen Automatisierungsprozess notwendige Datenqualität am besten gesichert werden kann.

 

Anhaltspunkte für die (letztlich aber freie und deshalb gegebenenfalls auch neu zu treffende) Entscheidung, wer welche Informationen liefern und für ihre Qualität einstehen muss, geben eher die allgemeinen Verfahrens- und Prozessrechtsgrundsätze. Das öffentliche Recht und noch stärker natürlich das Strafrecht werden insoweit vom Untersuchungsgrundsatz beherrscht, dem die Vorstellung zu Grunde liegt, eine richtige Entscheidung könne nur aufgrund richtiger Tatsachen getroffen werden. Die Behörden bzw. ggf. auch die Verwaltungs- bzw. Strafgerichte müssen einen Sachverhalt daher von Amts wegen ermitteln. Das Zivilrecht ist dagegen vom Verhandlungsgrundsatz geprägt und überlässt es deshalb den einzelnen Parteien, die (für sie günstigen) Informationen im Verfahren vorzubringen und ggf. zu beweisen. Soweit rechtliche Automatisierungsprozesse innerhalb dieser einzelnen Rechtsgebiete vorgenommen werden, ändert sich an diesen Grundsätzen nichts oder allenfalls wenig.

 

Staatliche Standardsetzung

Unabhängig davon, ob der Staat im Sinne einer Erfüllungsverantwortung selbst staatliche Daten erhebt und sie in einer notwendigen Qualität für einen rechtlichen Automatisierungsprozess bereithält oder ob er dies (auch) privaten Anbietern überlässt, steht es ihm stets frei, jedenfalls die Mindestqualitätsstandards festzulegen.

 

Er wird dies nicht in allen Bereichen machen, sondern in weiten Teilen der privaten Regulierung in Form etwa von DIN-Vorschriften überlassen.

 

Sofern er aber Maßstäbe, Referenzdaten und Qualitätsanforderungen für bestimmte Anwendungen festsetzen will, stehen ihm die klassische Stufung des öffentlichen Rechts mit Gesetzen, Rechtsverordnungen und Verwaltungsvorschriften zur Verfügung. Im Bereich der für die verschiedensten automatischen Anwendungen so maßgeblichen Kartographie etwa kommt dem Bundesamt für Kartographie und Geodäsie die Aufgabe zu, Referenzdaten zu erheben und bereitzustellen, wobei Referenzdaten anwendungsneutral Lage-, Höhen- und Schwereinformationen in Raum und Zeit beschreiben. Das maßgebliche Bundesgeoreferenzdatengesetz verlangt dabei eine „erforderliche Qualität“, die ihrerseits im Anhang der Technischen Richtlinie als geometrische und zeitliche Genauigkeit exakt benannt sind. Hinzu kommen die Vollständigkeit und die logische Konsistenz als weitere Qualitätsmerkmale, die aus Kompetenzgründen zwar nur für alle geodatenhaltenden Stellen des Bundes gelten, die der Sache nach aber auch von den Ländern sowie vor allem im Rahmen von Nutzungsrechten auch von privaten Dritten zu beachten sind.

 

Diese aus vielen Technikbereichen bekannte Regulierungsmethode lässt sich sicherlich auch für viele weitere Bereiche rechtlicher Automatisierungsprozesse fruchtbar machen, insbesondere für solche, bei denen gar nicht die rechtliche Entscheidung im Sinne einer Subsumtion im Vordergrund steht, sondern vielmehr die Errechnung des Sachverhalts. Minder bedeutsam ist dies nicht, denn jede rechtliche Entscheidung ist nur so gut wie die Qualität der Tatsachen, auf denen sie beruht.

 

 

 

 


[1] BVerfGE 105, 252 Ls. 1; 148, 40, 55.
[2] BVerwG, Urt. v. 29.08.2019 – 7 C 29.17, Rn. 47.