©
iStock bluejayphoto

 

 

Das Öl des 21. Jahrhunderts sprudelt fleißig und die Rosnefts, Aramcos und Exxons dieser Tage heißen Google, Meta, Alibaba oder Amazon. Immerhin gibt es keine Daten-OPEC, aber ohne Frage haben sich längst Abhängigkeiten in Form von marktbeherrschenden Geschäftsmodellen und Plattformen herausgebildet. Die resultieren Nutzungs- und Machtasymetrien erfordern Maßnahmen für neue Zugänge zu dem (Roh-) Stoff, aus dem Zukunft ist. Dass kann dem Entwurf zum europäischen Data Act gemäß der Zugang öffentlicher Stellen zu Unternehmensdaten im besonderen Bedarfsfall sein. Und vor allem die Eigennutzung, denn tatsächlich schlummern überall „öffentliche“ Datenschätze, mit denen das Kräfteverhältnis zumindest teilweise ausgeglichen werden könnte. Doch diese sind oftmals allein schon technisch nicht für besseres Regierung- und Verwaltungshandeln sowie für gemeinwohlorientierte Zwecke zugänglich. Für die Zukunft muss daher gelten: Die Datenpumpen müssen laufen – und zwar für alle!

Um es vorweg klarzustellen: Es geht nicht um die fragwürdige Praxis der Sammelwut oder der Vorratsdatenspeicherung von personenbezogenen oder personenbeziehbaren Daten. Vielmehr liegt der Schwerpunkt auf der Frage, wie gerade die öffentliche Hand – von der Politik bis hin zur kommunalen Verwaltung – mehr Evidenz in ihr Handeln bringen und mehr gemeinwohlorientierten Nutzen auf Grundlage ihrer Daten stiften kann. Da für die Entscheidungsfindung in komplexen politischen Situationen auch komplexe Daten nötig sind, muss das Prinzip einer generellen Datensparsamkeit – mit Ausnahme der bekannten und wohlbegründeten Fälle wie personenbezogen/personenbeziehbar, sicherheitskritisch, vertraulich/sensibel – aufgegeben werden. Nur wenn auf einen umfassenden Datenbestand zurückgegriffen werden kann, besteht die Chance, dass sich für ein sich stellendes Problem auch relevante Daten finden bzw. nutzen lassen. Da sich die ad hoc-Erzeugung passgenauer Daten im Regelfall kaum realisieren lassen dürfte, kommt es darauf an, Evidenz auf Basis der Kombination unterschiedlicher Quellen zu erzeugen. Dies erfordert eine Kombination aus Datenanalyse, Domänenwissen und politischem Kontext.

Maßgeblich ist dabei, dass Daten nicht als propriotärer Schatz verstanden werden. Die Idee, exklusiv erhobene Daten inklusiv zu nutzen, breit zu teilen und zur Verfügung zu stellen, lässt sich bis in die Mitte des 20. Jahrhunderts zurückverfolgen; als Initialzündug gilt das Internationale Geophysikalische Jahr 1957/58 (Korsmo 2007). Nachdem sich im Jahr 2007 in den USA erstmalig Internetaktivist:innen, Expert:innen und Entrepreneure trafen, um ein Konzept für „Open Government Data” zu skizzieren, wurden in den USA bereits im Jahr 2009 und in Großbritannien im Jahr 2010 die ersten nationalen „Open Data Portale“ initiiert. Mit zwei Jahren Verspätung fand das Konzept der offenen Nutzung auch Eingang in die bereits fortgeschrittene Diskussion auf Ebene der Europäischen Union (Kuzev et al. 2016, S. 19):

Der Wert von offenen Daten für Gesellschaft und Wirtschaft wurde von der Politik vergleichsweise spät entdeckt und die Nutzung nur halbherzig vorangetrieben – mit dem Ergebnis, dass oftmals auch der Politik selbst bzw. der öffentlichen Verwaltung die notwendigen Daten zur Entscheidungsfindung und Steuerung fehlen. Inzwischen mehren sich die Anzeichen, dass sich dies grundlegend ändern könnte. Allerdings muss gerade die öffentliche Verwaltung deutliche Anstregungen unternehmen, um ihre Datenbestände interoperabel und maschinenlesbar verfügbar zu machen. Hier ist zu prüfen, in welchen Fällen eine retrospektive Bereitstellung sinnvoll ist und in welchen Fällen eher auf die Bereitstellung von aktuellen Daten gesetzt werden sollte. Für viele Anwendungen, die auf dem Erfassen dynamischer Veränderungen aufsetzen, sind einmalig erhobene Datensätze oder auch Aktualisierungen im Jahresrhythmus nicht ausreichend; dies ist eine große Schwäche der amtlichen Statistiken, die der aktuellen Situation zudem meist ein oder zwei Jahre hinterherlaufen. Insbesondere Steuerungsinformationen erfordern kürzere Aktualisierungsintervalle bis hin zu Echtzeitinformationen (beispielsweise auch durch die Auswertung nichtquantitativer Daten durch semantische Analysen u. a. von Webinhalten): Eine Verkehrswegeplanung kann auf Grundlage einer Folge von Jahresstatistiken erfolgen, eine Verkehrssteuerung jedoch benötigt Echtzeitdaten über Staus, Ausfälle etc.

Datenquellen anbohren

Francesca Bria als ehemalige Chief Digital Technology and Innovation Officer der Stadt Barcelona formulierte das Credo „Holt euch eure Daten zurück!“ und sorgte für eine praktische Umsetzung, indem in öffentliche Verträge eine Klausel aufgenommen wurde, die besagt, „dass alle Daten, die im Zuge der Zusammenarbeit von privaten Auftragnehmern erhoben werden – ob durch Leihfahrräder oder bei der Telefon- und Internetnutzung – in maschinenlesbarer Form ans Rathaus abgegeben werden müssen und öffentlicher Besitz sind“ (Maak 2020). In der geschilderten Weise können somit auch Unternehmensdaten zu offenen Daten werden, wodurch sich der Nutzungsraum und das Datenangebot perspektivisch deutlich erweitert. Dabei ist besonders interessant, dass die Unternehmen oftmals einen konstanten Fluss an Daten erzeugen, der theoretisch für Echtzeitanwendungen und -geschäftsmodelle genutzt werden kann. Dabei werden die Ansprüche insbesondere mit Blick auf Smart Cities deutlich formuliert, nicht nur in Barcelona: „Relevante, nicht personalisierte Echtzeit-Daten aus Verwaltung, Wirtschaft und Sensornetzwerken werden gespeichert, aufbereitet, vernetzt und allen Bürger:innen zur Verfügung gestellt“ (Hansestadt Lübeck 2022).

Da Daten und ihre Nutzbarmachung die Grundlage der Digitalisierung sind und entsprechende Geschäftsmodelle bedingen, muss die Frage nach offenen Daten in den breiten Diskurs um die Beherrschung des Datenraums und die sich daraus ergebenden Abhängigkeiten gestellt werden. Dies drückt sich auch im Entwurf zum Data Act der Europäischen Kommission aus, der den Zugang zu Daten und deren Nutzung – auch zwischen Unternehmen und zwischen Unternehmen und Behörden – erleichtern soll (Bomhard und Merkle 2022). Ermöglicht werden soll innerhalb der geltenden Datenschutzvorschriften ein ausgewogenes Verhältnis zwischen dem Recht auf Zugang zu Daten und Anreizen für Investitionen in Daten. Mit den resultierenden europäischen Datenräumen soll eine Alternative zur marktbeherrschenden Praxis der großen Technologieplattformen geschaffen werden, deren Geschäftsmodelle sich auf die Nutzung aber auch Kontrolle großer Datenmengen stützen. In Deutschland bezieht sich die weitere Ausgestaltung des Rechtsrahmens explizit auf den Data Act (Stand Frühjahr 2022): „Vieles hängt davon ab, wie der Data Act wirklich aussehen wird. Wo fehlt noch etwas, welche Spielräume gibt es? Davon hängt wiederum die weitere gesetzliche Ausgestaltung ab – zum Beispiel bei einem nationalen Datengesetz oder einem speziellen Mobilitätsdatengesetz“ (Voß 2022); gemäß der aktuellen Mobilitätsdatenverordnung werden meist nur statische Daten wie Fahrpläne etc. bereitgestellt, nicht aber Angaben zur Fahrzeugauslastung, Geodaten einzelner Fahrzeuge, Verspätungen und andere. Die Mobilitätsdienstleister stehen der Weitergabe dynamisch erhobener Daten skeptisch gegenüber, da durch sie Rückschlüsse auf Preismodelle möglich seien (Delhaes 2021). Brüchig wird diese Argumentation jedoch spätestens dann, wenn die Mobilitätsanbieter kommunale Unternehmen wie etwa städtische Verkehrsbetriebe – und somit öffentlich – sind.

Das Potenzial von offenen Daten

Die Rolle von offenen Verwaltungsdaten für die wirtschaftliche und gesellschaftliche Nutzung über ihren ursprünglichen Erhebungs- und Verwendungszweck hinaus gilt als besonders bedeutsam, da sich die Daten im Regelfall durch eine hohe Qualität und damit Verlässlichkeit auszeichnen. Ebenso werden bestimmte Daten von allen Kommunen erhoben, sodass prinzipiell eine hohe querschnittliche Vergleichbarkeit gegeben ist. Der Wert von offenen Daten wird in der Schaffung von Transparenz und besserem Regierungshandeln, einer stärkeren Partizipation an Entscheidungs- und Planungsprozessen, eine verbesserte Innovationsfähigkeit mitsamt der Grundlage für neue (kommerzielle) Geschäftsmodelle etc. gesehen (Open Knowledge Foundation ohne Jahr). Die wirtschaftliche Bedeutung von offenen Daten – unabhängig von deren Ursprung (öffentliche Verwaltungen, Hochschulen, Organisationen, Unternehmen) – ist signifikant. In einer Szenariobetrachtung für Deutschland wurde in einer mittleren Variante ein Potenzial von rund 43 Milliarden Euro pro Jahr bzw. 20.000 Arbeitsplätzen ermittelt, sofern eine proaktive Strategie im Hinblick auf offene Daten verfolgt wird (Kuzev et al. 2016, 54 ff.). Erfahrungen aus anderen Ländern legen zudem nahe, dass die öffentliche Verwaltung selbst eine Profiteurin offener Verwaltungsdaten ist, da auf diese Weise eine einfachere behördenübergreifende Datennutzung möglich ist (Bundesverwaltungsamt 2018, S. 14).

Da öffentliche Echtzeitdaten insbesondere auch für Unternehmen interessant sind, um darauf basierend kommerzielle Dienste anzubieten, ist es im Umkehrschluss naheliegend, Unternehmensdaten, die im Zuge von öffentlich finanzierten Aufträgen generiert werden, nach dem Vorbild der Innovationsklausel in Verträgen der Stadt Barcelona auch öffentlich nutzbar zu machen. In jedem Fall aber ist zu vermeiden, dass ursprünglich öffentliche Daten einseitig einigen wenigen Unternehmen zur Verfügung gestellt werden, die sie kommerziell nutzen. Ebenso müssen bestehende Zugangsrestiktionen zu öffentlich finanzierten Daten verringert werden. Denkbar sind hier allgemeine Freigaben nach einer Frist zur exklusiven Nutzung durch die Datenerhebenden. Die Regulierung der offenen Datennutzung könnte dabei angesichts der vielfach denkbaren Implikationen von vorherein als dynamisches Instrument angelegt werden, das bewusst Präzedenzfälle sucht, um den Rechtsrahmen mittels Rechtssprechung im Sinne einer „Humble Regulation“ in der Praxis auszubuchstabieren (Annala et al. 2020).

Die Datenpumpen müssen laufen

Die Datenbereitstellung kann die Dateninfrastruktur stärken, auch wenn der konkrete Anwendungsfall noch gar nicht eingetreten ist. „Daten als Rohöl“ müssen demnach in gewisser Weise auf Halde erhoben und vorgehalten werden. Dies erfordert ein grundsätzliches Umdenken beim Umgang mindestens mit öffentlichen Daten, der bisher noch oft vom Prinzip der – datenschutzrechtlich mehr als nachvollziehbaren – Datensparsamkeit geprägt ist. Das Primat der Datensparsamkeit sollte der Rechtslage folgend nur für personenbezogene und personenbeziehbare Daten angewendet werden. Neben personenbezogenen Daten ist auch die Souveränität von Unternehmensdaten zu berücksichtigen. Darüber hinaus scheint ein Mehr an Daten unverzichtbar, wenn denn wirklich Ernst gemacht werden soll mit datengetriebenen und evidenzbasierten Entscheidungen, auch wenn gegenwärtig noch nicht absehbar ist, welche negativen Implikationen damit verbunden sein können. Schließlich ist denkbar, dass durch die Datenauswertung auch Muster erkennbar werden, die auf Schwachstellen von Systemen hindeuten, die für Angriffe ausgenutzt werden könnten. Auch das Einspeisen von manipulierten Daten in die öffentlich zugänglichen bzw. wirtschaftlich und für Entscheidungen genutzten Kanäle bietet ein auf den ersten Blick erkennbares Schadenspotenzial. Andererseits muss klar sein, dass ohne das Korrektiv öffentlicher Daten in erster Linie solche Daten genutzt werden, deren Zugriff und Deutungshoheit zunächst bei privaten Unternehmen liegen. Und auch wenn absehbar ist, dass die datenintensiven Tech-Unternehmen die offenen Daten in ihre Bestände integrieren und mit ihren eigenen Daten kombinieren werden, kann sich durch das Konzept der offenen Daten die „Informationsasymmetrie“ verringern, denn bisher steht den privaten Repositorien schlicht eine öffentliche Fehlstelle gegenüber.

Gemeinwohl erfordert ein Geben und Nehmen

In Deutschland zeichnen sich für die kommenden Jahre konkrete Fortschritte bei der Nutzung von Daten für die Politikgestaltung ab. So sieht die Datenstrategie der Bundesregierung vor, dass in ihren Ressorts und nachgeordneten Bundesbehörden Datenlabore entstehen (Die Bundesregierung 2021, 61 f.). Diese internen Einheiten sollen Ressort- und Behördendaten urbar machen und mit entsprechender Expertise und Kapazität die Umsetzung interner Projekte begleiten (Rusch 2022). Weiterhuin soll ein neu zu installierendes Dateninstitut vor allem datenbasierte Ressourcen für verschiedene Stakeholder-Gruppen in der Gesellschaft zugänglich machen. Der Koalitionsvertrag sieht vor, dass ein Dateninstitut die Verfügbarkeit und Standardisierung von Daten ermöglicht und Datentreuhändermodelle und Lizenzen etabliert (SPD, B90/Die Grünen, FDP 2021, S. 17). Dabei geht der Ansatz über die Bereitstellung von Verwaltungsdaten hinaus. So soll auch ein Zugang zu Unternehmensdaten möglich werden, wenn dies unter Wettbewerbsbedingungen möglich ist. Dies kann Bund, Länder und Kommunen in der Daseinsvorsorge unterstützen. Ein Datengesetz auf Bundesebene soll die Mitwirkung am Datenaufbau der Datenbestände, Standardisierung und Zugang auf rechtlich sichere Füße stellen (SPD, B90/Die Grünen, FDP 2021, S. 17).

Um Daten umfassend für derartige politische Steuerungsprozesse – sei es auf Ebene von Kommunen und Smart Cities oder auf Landes- und Bundesebene – nutzbar zu machen, müssen sie zunächst maschinenlesbar bereitgestellt werden. In einem ersten Schritt umfasst dies bestehende Daten, die bisher noch in Silos verschlossen vorliegen. In einem zweiten Schritt sollte dies auch neue bzw. bisher nicht digitalisierte Datenbestände inkl. „public company data“ umfassen. Dies geschieht natürlich immer mit dem Risiko, dass einzelne Daten nicht zeitnah genutzt werden, verringert aber das Risiko, dass Daten bei dringendem Bedarf nicht vorliegen. Insgesamt wird es darauf ankommen, nicht für jede neue Fragestellung erst aufwändig neue Daten zu erheben, sondern durch die intelligente Kombination und Triangulation von bestehenden Daten Antworten zu finden. Hier geht es um approximierte Indikatoren und die Gleichsetzung von Items innerhalb zulässiger Grenzen. Um diese Aufgaben eigenständig oder im Zusammenspiel mit Dienstleistern durchführen und steuern zu können, müssen die für die Nutzung und Interpretation notwendigen Datenkompetenzen in der öffentlichen Verwaltung noch stärker als bisher aufgebaut werden (Kuhlmann et al. 2021; Kupi et al. 2022). Dabei gilt, dass auch bei spezifisch und passgenau für eine Fragestellung erhobenen Daten Evidenz nicht immer „Ja“ oder „Nein“ bedeutet, sondern die Ergebnisse – etwa bei Befragungen – stets auch variieren und somit mehr oder weniger klar sind. Evidenz ist somit nicht das Gegenteil von Ambivalenz, sondern mindestens der Versuch, diese so deutlich und regelhaft wie möglich darzustellen. Und es ist ein entscheidender Schritt, sich nicht in die (weitere) Abhängigkeit einer „Daten-OPEC“ zu begeben.

 

Dr. Marc Bovenschulte, VDI/VDE Innovation + Technik GmbH, Berlin

Dieser Beitrag ist eine Kurzfassung des Positionspapier „Holt euch eure Entscheidungsgrundlage (zurück)! Wie Datenpolitik dafür sorgen kann, dass Daten für politische Entscheidungen und Steuerung genutzt werden können“ der VDI/VDE-IT und der dort genannten Autor:innen.

 

Literaturverzeichnis

Annala, Mikko; Leppänen, Juha; Mertsola, Silva, Sabel, Charles F. (2020): Humble Government: How to Realize Ambitious Reforms Prudently. Demos Helsinki (Government’s Analysis, Assessment and Research Activities). Online verfügbar unter https://tietokayttoon.fi/documents/1927382/2158283/Humble+Government.pdf/efbd7017-8546-7996-e249-c6f2008fe2d4/Humble+Government.pdf?t=1605254807206, zuletzt geprüft am 30.04.2022.

Bomhard, David; Merkle, Marieke (2022): EU-Kommission legt Vorschlag für Data Act vor – Neuer Rechtsrahmen für die Data Economy. Hg. v. Noerr. München. Online verfügbar unter https://www.noerr.com/de/newsroom/news/eu-kommission-legt-vorschlag-fur-data-act-vor, zuletzt aktualisiert am 23.02.2022, zuletzt geprüft am 07.06.2022.

Bundesverwaltungsamt (2018): Handbuch für offene Verwaltungsdaten des BVA. Köln. Online verfügbar unter https://www.verwaltung-innovativ.de/SharedDocs/Publikationen/eGovernment/open_data_handbuch.pdf?__blob=publicationFile&v=2.

Delhaes, Daniel (2021): Auslastung, Verspätungen, Geodaten: Verkehrsanbieter behalten ihre sensiblen Informationen. Handelsblatt. Online verfügbar unter https://www.handelsblatt.com/politik/deutschland/mobilitaetsdatenverordnung-auslastung-verspaetungen-geodaten-verkehrsanbieter-behalten-ihre-sensiblen-informationen/27438156.html, zuletzt aktualisiert am 21.07.2021, zuletzt geprüft am 30.04.2022.

Die Bundesregierung (Hg.) (2021): Datenstrategie der Bundesregierung. Eine Innovationsstrategie für gesellschaftlichen Fortschritt und nachhaltiges Wachstum. Kabinettfassung, 27. Januar 2021. Berlin. Online verfügbar unter https://www.bundesregierung.de/resource/blob/992814/1845634/f073096a398e59573c7526feaadd43c4/datenstrategie-der-bundesregierung-download-bpa-data.pdf, zuletzt geprüft am 13.02.2022.

Hansestadt Lübeck (2022): Open Data – Das digitale Gehirn der Hansestadt. Lübeck. Online verfügbar unter https://www.luebeck.de/de/stadtentwicklung/smart-city-luebeck/projekte-und-massnahmen/open-data/index.html, zuletzt geprüft am 20.02.2022.

Korsmo, Fae L. (2007): The Genesis of the International Geophysical Year. In: Physics Today 60 (7), S. 38–43. DOI: 10.1063/1.2761801.

Kuhlmann, Sabine; Franzke, Jochen; Dumas, Benoit; Heine Moreen (2021): Daten als Grundlage für wissenschaftliche Politikberatung. Im Auftrag des Bundesministeriums für Bildung und Forschung (BMBF) im Rahmen des Projekt-teams „Forschung und Beratung zur Krisenbewältigung COVID-19-Pandemie“. Universität Potsdam. Online verfügbar unter https://www.uni-potsdam.de/fileadmin/projects/ls-kuhlmann/Politikberatung/Daten-Politikberatung-Kuhlmann-et-al-13-9-21.pdf, zuletzt geprüft am 01.05.2022.

Kupi, Maximillian; Jankin, Slava; Hammerschmidt, Gerhard (2022): Data Science und KI in der Verwaltung. Warum Organisationen des öffentlichen Sektors eigene Expertise für Data Science und künstliche Intelligenz benötigen. Hertie School. Berlin (Policy Brief). Online verfügbar unter https://hertieschool-f4e6.kxcdn.com/fileadmin/2_Research/2_Research_directory/Research_Centres/Centre_for_Digital_Governance/2020-01_Documents/HS_Policy_Brief_German_Final_Version_Print.pdf, zuletzt geprüft am 01.05.2022.

Kuzev, Pencho; Dapp, Marcus M.; Balta, Dian; Palmetshofer, Walter; Krcmar, Helmut (2016): Open Data. The Benefits. Das volkswirtschaftliche Potential für Deutschland. Hg. v. Konrad-Adenauer-Stiftung e.V. Berlin. Online verfügbar unter https://www.kas.de/documents/252038/253252/7_dokument_dok_pdf_44906_1.pdf/3fbb9ec5-096c-076e-1cc4-473cd84784df?version=1.0&t=1539650934955.

Maak, Niklas (2020): „Holt euch eure Daten zurück!“. Interview mit Francesca Bria. In: Frankfurter Allgemeine Zeitung, 2020. Online verfügbar unter https://www.faz.net/aktuell/feuilleton/francesca-bria-im-interview-holt-euch-eure-daten-zurueck-17007960.html, zuletzt geprüft am 20.02.2022.

Open KNowledge Foundation (Hg.) (ohne Jahr): Wieso eigentlich offene Daten? Open Data Handbook. Online verfügbar unter http://opendatahandbook.org/guide/de/why-open-data/.

Rusch, Lina (2022): Datenstrategie: Erste Datenlabore starten. Tagesspiegel. Berlin (Background Digitalisierung & KI). Online verfügbar unter https://background.tagesspiegel.de/digitalisierung/erste-datenlabore-starten, zuletzt aktualisiert am 26.01.2022, zuletzt geprüft am 26.04.2022.

SPD, B90/Die Grünen, FDP (Hg.) (2021): Mehr Fortschritt wagen: Bündnis für Freiheit, Gerechtigkeit und Nachhaltigkeit. Koalitionsvertrag 2021 – 2025 zwischen der Sozialdemokratischen Partei Deutschlands (SPD), BÜNDNIS 90 / DIE GRÜNEN und den Freien Demokraten (FDP). Berlin. Online verfügbar unter https://www.spd.de/fileadmin/Dokumente/Koalitionsvertrag/Koalitionsvertrag_2021-2025.pdf, zuletzt geprüft am 01.12.2021.

Voß, Oliver (2022): Unsere Aufgabe ist eine konsistente Digitalpolitik mit einem roten Faden. Interview mit Stefan Schnorr, Staatsekretär im Bundesministerium für Digitales und Verkehr. Unter Mitarbeit von Lina Rusch. Tagesspiegel. Berlin (Background Digitalisierung & KI). Online verfügbar unter https://background.tagesspiegel.de/digitalisierung/unsere-aufgabe-ist-eine-konsistente-digitalpolitik-mit-einem-roten-faden?utm_source=bgdi+vorschau&utm_medium=email, zuletzt aktualisiert am 21.02.2022, zuletzt geprüft am 21.02.2022.