Mit fortschreitender Digitalisierung sind der Umfang und die Vielfalt verfügbarer Daten exponentiell gewachsen. Da Daten als eine der wertvollsten Ressourcen des 21. Jahrhunderts gelten, ist ihre effiziente Nutzung von großer Bedeutung und Herausforderung zugleich. Eine vielversprechende Lösung dafür ist Data Pooling über Data-Sharing-Plattformen: Derartige Plattformen ermöglichen es, Daten aus verschiedenen Quellen zu sammeln, zu konsolidieren und gemeinsam zu nutzen. Dadurch ergeben sich neue Möglichkeiten für die Entwicklung neuer digitaler Services sowie wissenschaftliche Erkenntnisse und unternehmerisches Wachstum. Das vorliegende Whitepaper gibt einen Überblick über das Thema Data Pooling und betrachtet Einsatzmöglichkeiten von künstlicher Intelligenz (KI) für und auf Data Pools.
Funktional, sicher und rechtskonform – Anforderungen an Data Pools
Um funktionsfähig, sicher und attraktiv für Unternehmen zu sein, soll jede Data-Plattform bestimmte Anforderungen im Hinblick auf Technologie, Organisation, Sicherheit und Regulatorik erfüllen. Ein Beispiel für eine organisatorische Anforderung ist eine klare Governance-Struktur: Die Plattform sollte klare Regeln für den Zugriff auf Daten, ihre Nutzung und ihre Weitergabe festlegen. Nur so kann sichergestellt werden, dass die Daten von allen Nutzenden verantwortungsvoll und angemessen verwendet werden. Außerdem sollte eine Data-Sharing-Plattform ein robustes Zugangs- und Authentifizierungsmanagement aufweisen, um zu garantieren, dass nur autorisierte Personen Zugang zu den Daten haben. Von Seiten des Gesetzgebers werden ebenfalls Anforderungen an Data-Sharing-Plattformen gestellt: Neben dem Digital Markets Act und Digital Service Act, muss auch die Konformität mit dem EU AI-Act aufgewiesen werden, sollten auf der Plattform beispielsweise KI-Anwendungen eingesetzt werden.
Geschäftsmodelle von Data-Sharing-Plattformen
Data-Sharing-Plattformen ermöglichen es Datenanbietern, ihre Datenbestände zu monetarisieren. Denn sie bieten Datenkonsumenten eine bequeme und effiziente Möglichkeit, auf relevante Daten zuzugreifen. Doch Geschäftsmodelle unterscheiden sich von Plattform zu Plattform. So definiert der Marktzugang den Grad der Offenheit einer Plattform: Geschlossene Plattformen bieten höhere Sicherheit und Vertrauen, während offene Plattformen durch ihre Zugänglichkeit in der Regel eine größere Vielfalt an Datenquellen bereitstellen können. In Bezug auf die Einnahmen unterscheiden sich Data-Sharing-Plattformen durch Erlösmodelle: Dazu gehören beispielsweise Abonnementgebühren für einen Premium-Zugang, Transaktionsgebühren für den Ein- und Verkauf von Daten auf dem Marktplatz, Lizenzgebühren für die Datennutzung und vieles mehr.
Große Vorteile für KI-Entwicklung
Große Datenmengen, die über Data Pools verfügbar gemacht werden, bieten ein enormes Einsatzpotenzial für KI. Durch die Zusammenführung und Bereitstellung größerer und repräsentativerer Datenmengen können genauere und robuster trainierte KI-Modelle entwickelt werden. Zudem ermöglicht Data Pooling den Zugang zu vielfältigeren Datenquellen und reduziert Verzerrungen und Voreingenommenheit in Datensätzen. Es beschleunigt auch die Entwicklung und den Einsatz von KI-Modellen: Anstatt Daten von Grund auf neu sammeln oder generieren zu müssen, können Entwicklerinnen und Entwickler oder Forscherinnen und Forscher auf bereits vorhandene Datensätze zurückgreifen, was Zeit, Ressourcen und Kosten spart.
Das Whitepaper mit detaillierten Informationen zu Data-Sharing-Plattformen und Handlungsempfehlungen für Unternehmen finden Sie unter folgendem Link.