Zum Hauptinhalt springen
DE EN

Dieser Inhalt ist in der gewünschten Sprache nicht verfügbar

Datenminimalismus: Schaden Netflix & Co. unserem Klima?
Technologie

Datenminimalismus: Schaden Netflix & Co. unserem Klima?

Streaming, Voice Assistants, Künstliche Intelligenz (KI): Weltweit nehmen Datenströme seit Jahren zu

17.09.2019 Autor Ingo Bertram Lesedauer: 4 Minuten
Neue, komplexe KI-Anwendungen, 5G-Netze und Smart Home befeuern diesen Trend. Droht ein Datenoverkill? Wie viele Datensätze braucht Künstliche Intelligenz wirklich? Und welchen Einfluss hat der globale Datenverkehr eigentlich auf Klima und Umwelt? Ein Gespräch mit Dr. Michaela Regneri, Senior Expert AI & Cognitive Computing bei OTTO

Michaela, wer heute im Netz unterwegs ist, hinterlässt unzählige Datenspuren. Für Konzerne sind solche Datenspuren doch ein gefundenes Fressen, oder?

DR. MICHAELA REGNERI: Nein, das ist ein Irrglaube. Manchmal sind gar keine Daten besser als schlechte Daten. Da wird man wenigstens nicht in die Irre geführt und weiß, dass man nichts weiß.

Bei Daten ist weniger also manchmal doch mehr?

Genau das wollten meine Kolleg*innen und ich herausfinden und haben deshalb bei OTTO ein Experiment durchgeführt. Uns hat interessiert, wie wertvoll die Daten sind, die uns zur Verfügung stehen – und ob es eventuell auch Daten gibt, auf deren Erhebung wir verzichten können. Eine vermeintlich einfache Ausgangslage also.

Warum vermeintlich?

Weil alle großen Unternehmen mit immer größeren Datenmengen jonglieren. Das ist schon heute ein hochkomplexes Feld. Wir haben unser Experiment daher exemplarisch auf eine Anwendung konzentriert, in diesem Fall die Produktempfehlungen auf otto.de. Welche*r Kund*in dort welche Artikel angezeigt bekommt und welche nicht, entscheidet eine KI-Anwendung, die mit verschiedenen Datensätzen gefüttert wird. Wir haben uns gefragt: Wie viele Daten brauchen wir eigentlich, damit eine solche Anwendung für uns profitabel ist?

Eine naheliegende Vermutung wäre ja eigentlich: „Je mehr, desto besser“…

Ja, nur das ist es eben nicht. Wir haben gesehen, dass mehr Daten ab einem bestimmten Punkt die Qualität nicht mehr verbessern und dass manche Datensätze sogar schädlich sein können.

Kannst Du das konkretisieren?

Bei den Produktempfehlungen haben mehr Daten zwar geholfen, Empfehlungen für mehr unterschiedliche Produkte zu berechnen. Allerdings wurde gleichzeitig die Qualität der Empfehlungen schlechter – was natürlich nicht in unserem Sinne ist.

Künstliche Intelligenz wird also schlechter, wenn sie mit zu vielen Daten gefüttert wird?

Das hängt von der Aufgabe ab, die man lösen möchte, vom benutzten Algorithmus und von der Qualität der Daten selbst. Zu viele Daten bedeuten im Bestfall nur unnötige Kosten und Zeitverschwendung. Im schlechtesten Fall bedeutet es, dass die Ergebnisse nicht mehr gut sind.

Aber warum sammeln dann manche Tech-Unternehmen trotzdem Daten scheinbar ohne Limit? Ist das nicht kontraproduktiv?

Das Sammeln an sich hat auf die Qualität noch keinen Einfluss. Interessant wird es erst, wenn aus den gesammelten Nutze*innenrdaten KI-Entscheidungen gebaut werden und diese plötzlich auf zu großen oder falsch zusammengesetzten Datenpools basieren. Das hätte verfälschte Ergebnisse zur Folge.

Und dennoch wächst der weltweite Datenbestand jeden Tag immens.

Ja. Das Problem ist aber eher, dass Daten, die gesammelt werden, auch in großem Stil verarbeitet, gespeichert, bewegt werden müssen. Und das wiederum kostet Ressourcen, allen voran Strom, aber auch Wasser für die energiehungrigen Serverfarmen. Neue KI-Technologien wie das Deep Learning, das viele Berechnungsprozesse gleichzeitig laufen lässt, sind besonders energieintensiv – und der Verbrauch steigt mit steigender Datenmenge weiter an. Daten verursachen also indirekt CO2-Ausstoß. Für KI-Anwendungen gilt das genauso wie für alltägliche Dinge, etwa Streaming von Musik oder Filmen und mobiles Surfen. Das ist vielen gar nicht richtig bewusst.

Dr. Michaela Regneri Der Anteil des datenbasierten CO2-Ausstoßes am gesamten CO2-Ausstoß der Erde ist umstritten – er reicht von 1,5 bis 5 Prozent. Damit ist er allerdings schon heute auf einer Ebene mit dem Flugverkehr.

Dr. Michaela Regneri

Über was für eine Größenordnung sprechen wir hier?

Der Anteil des datenbasierten CO2-Ausstoßes am gesamten CO2-Ausstoß der Erde ist umstritten – er reicht von 1,5 bis 5 Prozent. Damit ist er allerdings schon heute auf einer Ebene mit dem Flugverkehr. Und: Die weltweit erzeugte Datenmenge wächst exponentiell, das ist beim Flugverkehr glücklicherweise unmöglich. So lange es keine globale Strategie für die Energiewende gibt, sind digitale Technologien also durchaus eine bislang unterschätze Klimabedrohung.

Wenn wir ökologisch korrekt leben möchten, sollten wir also nicht nur auf Flugreisen verzichten, sondern auch auf Netflix, Dropbox und YouTube?

Von Dogmatismus halte ich nichts. Zwar gibt es in der Tat zunehmend Hinweise, dass vor allem Streamingdienste einen messbaren Impact aufs Klima haben. Was auch naheliegt, schließlich werden für Dienste wie Spotify, Netflix & Co. jede Menge Daten transportiert – und das kostet nun mal Ressourcen, allen voran Strom. Allerdings darf man die Verhältnismäßigkeit nicht aus den Augen verlieren: Eine Folge „Game of Thrones“ etwa belastet das Klima im Schnitt mit 400g CO2, ein Kilo Rindfleisch hingegen kommt auf 27kg CO2. Bevor ich also auf meine Lieblingsserie verzichte, esse ich lieber mal ein veganes Chili.

Also keine Kehrtwende bei der Digitalisierung …

Nein, das ist keine Lösung. Viel wichtiger finde ich, dass wir unseren Umgang mit Daten überdenken und uns stärker darauf konzentrieren, welche Daten wir zu welchem Zweck speichern und einsetzen müssen. Datenminimalismus ist das Stichwort. Das spart nicht nur Strom, Geld und Zeit bei der Berechnung, es nutzt sogar dem*der Endkund*in. Schließlich ist jeder Datenpunkt, der nicht bewegt wird, ein mögliches Sicherheitsrisiko weniger. Für mein Arbeitsfeld heißt das: Wir müssen KI-Prozesse noch besser verstehen, besser designen und noch gründlicher monitoren.

Tags in diesem Artikel: