Wie Blockchain und KI zum Internet der kollektiven Intelligenz konvergieren

Schönes neues World Wide Web

Die Katze ging auf den grünen Kater zu und sah ihn mit ihren bernsteinfarbenen Augen an. „Hallo“, sprach die Katze ihn an. „Ich bin Stella.“ Der grüne Kater überlegte kurz und sagte dann: „Ich bin Fuchs.“ „Fuchs?“, fragte Stella. „Wie originell.“ Sie lachte kurz und sagte dann: „Und du bist der Sprecher der Krieger.“

Diese Zeilen könnten der Feder eines fantasievollen Autors entstammen, der magische Welten entwirft. Und in der Tat ist es eine magische Welt – entworfen jedoch von einer künstlichen Intelligenz mit dem Namen GPT-3. Die einzige Eingabe, die dazu erforderlich war, ist der Satz „Eine Katze mit Flügeln ging im Park spazieren”. GPT-3 entwarf die Begegnung von Stella und Fuchs über 77 Zeilen hinweg. Der Dialog ist nur eine unter zahlreichen Anwendungen, die Entwickler seit Start der Betaphase im Internet veröffentlicht haben. Die Grenzen zwischen dem, was menschlich ist und was künstlich erschaffen wurde, verschwimmen hierbei auf geradezu beängstigende Art und Weise. GPT-3 ist das derzeit am weitesten entwickelte Modell aus dem Bereich des NLP (Natural Language Processing), also des Bereichs, der sich mit geschriebener und gesprochener Sprache beschäftigt. Wie viele moderne Modelle basiert GPT-3 auf der Technologie der neuronalen Netze („Deep Learning“) und verwendet für seine Berechnungen 10x mehr Parameter als jedes bisherige Modell. Dies macht das Training des Modells aufwändig, langwierig und teuer. Die Ergebnisse der Berechnungen sind beeindruckend und ein unglaublicher Fortschritt im Vergleich mit bisherigen Modellen. Extrapoliert man diese Entwicklung, so stellen die Szenarien jeden Science-Fiction-Film in den Schatten.

KI – Die komprimierte Wissensdatenbank

Stellt man GPT-3 allerdings die Frage „Wie viele Augen hat mein Fuß“, wird dies von der künstlichen Intelligenz wenig „intelligent“ mit „Zwei.“ beantwortet. Der Grund für diese absurde Antwort ist, dass durch die Trainingsdatensätze eine Beziehung zwischen der Anzahl der Augen und einem Objekt etabliert wurde. Die Bezeichnung als „künstliche Intelligenz“ ist also ungenau und wird von Forschern auf dem Gebiet daher häufig gemieden: Die Technologie ist vielmehr eine gigantische komprimierte Wissensdatenbank, die anhand beliebig kombinierbarer Einträge rasend schnell „neue“ realistische Werke zu kreieren vermag. Hierin liegt auch der eigentliche Fortschritt und das Potential der Technologie: Die meisten alltäglichen Tätigkeiten sind schlichte „Remixe“ aus vorhandenen Bausteinen, wie zum Beispiel Autofahren oder E-Mails schreiben. Besonders raffiniert werden diese Routinen erst durch den menschlich-kreativen Beitrag: Das Personalisieren der E-Mail mit einer persönlichen Anmerkung oder etwa vorausschauendes Fahren, da auf der Wiese nebenan Kinder Ballspielen. Angewandt auf die richtigen Probleme hat diese Form der KI als Wissensdatenbank eine große Zukunft.

Schwierige Monetarisierbarkeit führt zu Datenmonopolen

KI-Start-ups haben weltweit seit 2017 über 85 Mrd. USD geraist und dennoch Schwierigkeiten, die Technologie gewinnbringend zu monetarisieren. Ein Hauptgrund ist das Long Tail-Problem (siehe Grafik): Eine kleine Anzahl von Objekten oder Ereignissen kommt häufig vor, der Großteil hingegen selten. Für eine große Anzahl an Fällen lässt sich so ein zuverlässiges Modell konstruieren, das leicht kopierbar ist. Für die übrigen Fälle ist jedoch kostenintensive Kleinstarbeit und menschliche Interaktion notwendig, und das bei limitierter Skalierbarkeit. Ein Beispiel ist die Sprache. Diese besteht aus einem sehr häufig verwendeten Kernvokabular, dem ein großer, selten verwendeter Wortschatz gegenüber steht.

Das Long Tail-Problem am Beispiel der deutschen Sprache
Das Long Tail-Problem am Beispiel der deutschen Sprache

Datenmonopole bergen erhebliche Risiken

Die Zukunft von KI liegt dort, wo Muster eine Rolle spielen. KI vermag, sie zu erkennen (zum Beispiel Gesichter) oder neu zu kombinieren (beispielsweise Erstellung künstlicher Gesichter). Notwendig für das Training der KI ist das Sammeln massiver Mengen von heterogenen Daten. Das Datensammeln macht dabei nicht nur die Modelle besser, sondern eröffnet vor allem Ansätze zur Lösung des Long Tail-Problems: So lassen sich überhaupt erst solche Kundensegmente erschließen, die kleinere, speziellere Modelle benötigen. Die sehr große, diverse Datenmasse kann aber auch den Long Tail verkleinern, damit die Skalierung verbessern und die Kosten für die Modelle senken. Die notwendigen Trainingsdaten können dabei auf zwei Arten gesammelt werden: zentral oder dezentral. Durch das zentrale Speichern und Anreichern der Daten entstehen bessere Modelle mit überlegener Monetarisierbarkeit, was mit der Zeit zum Heranwachsen gigantischer Datenmonopole führt. Im besten Falle entstehen dabei auch bessere Dienste, die uns das Leben immer weiter erleichtern; im schlimmsten Falle führt dies zur totalen Kontrolle über die Informationen eines Individuums und der Entstehung von Black Boxes, deren Entscheidungen nicht mehr nachvollziehbar sind. In jedem Fall jedoch führt der zentralisierte Weg zur Aushöhlung der Privatsphäre und zu einem Single Point of Failure, bei dem Berechnungsmodelle intransparent und hinter verschlossenen Türen entstehen.

Die Grenzen des heutigen Internets

Der dezentrale Weg kann dieser Entwicklung entgegenwirken, erfordert jedoch einen radikalen Umbau der Architektur des heutigen Internets. Das Internet wurde ursprünglich als Gerätenetzwerk entwickelt; es wurde zum Datenaustausch konzipiert und die zugrunde liegenden Protokolle hierfür optimiert. Um ins Internet zu gelangen, musste man „online gehen“. Nur durch den eigenen Webserver war eine Internetpräsenz in Form einer Website oder E-Mail-Adresse möglich. Damit war es gleichzeitig ein Netzwerk der Nutzer, an dem man aktiv teilnehmen musste. Heute ist es hingegen selbstverständlich, dass man „online ist“ – auch ohne eigenen Webserver. Möglich ist dies durch die Client Server-Infrastruktur, die es einem Gerät (dem Client) erlaubt, einen Dienst (angeboten vom Server) in Anspruch zu nehmen. Diese Arbeitsteilung – in Geräte mit großen Rechenressourcen (Server) auf der einen und Geräte mit Interface (Client) auf der anderen Seite – ist die dominante Infrastruktur des heutigen Internets. Dadurch wurde allerdings das ursprüngliche Eins-zu-eins-Verhältnis zwischen Geräten und Nutzern aufgehoben, und an die Stelle des eigenen Webservers traten zentrale Dienste, die die Webpräsenz des Nutzers für diesen aufrechterhalten. Es war weder geplant noch absehbar, dass die Inanspruchnahme dieser Dienste gleichzeitig eine erhebliche Verschiebung des Besitzes an den persönlichen Daten des Nutzers mit sich bringen würde. Der Besitz dieser Daten ging nun in großem Ausmaß vom Nutzer auf die Dienste über. Diese Entwicklung bildete die Keimzelle für den großen wirtschaftlichen Erfolg einzelner Dienste und beschleunigte die Digitalisierung zahlreicher Lebensbereiche. In der Folge bildete sich eine digitale Identität heraus, die sich nur scheinbar in unserem Besitz befindet und deren Zugang nicht vom Nutzer kontrolliert wird. Die Nachteile der Datenaustauschinfrastruktur kommen immer deutlicher zum Vorschein: Dem Internet fehlen Protokolle, die neben digitalem Besitz auch eine digitale Identität ermöglichen, ohne dass der Nutzer eigene Server betreiben muss. Genau das bietet die Blockchain.

Blockchain: eine Datenbank, die niemandem gehört

Die Blockchain basiert auf einer intuitiven Idee: eine globale Datenbank, in der Besitz und Identität digital verankert sind. Die eigentliche Innovation besteht darin, dass diese Datenbank niemandem gehört und somit von niemandem kontrolliert werden kann. Ausschließlich der Besitzer der Daten kann Modifikationen an seinem Besitz (z.B. Wertübertragung in Form von Bitcoin oder Token) oder der eigenen Identität (z.B. Kontrolle über die persönlichen Daten) vornehmen. Per Design stellt die Blockchain damit eine robuste und sichere Infrastruktur dar, welche die Privatsphäre wahrt. Der offene Zugang in Kombination mit verschlüsselten Einträgen macht klassische Plattformhacks sinnlos. Durch die Abwesenheit zentraler Kontrolle können nur einzelne Personen gehackt werden, nie jedoch ganze Plattformen mit Millionen von Nutzern. Die Vorteile der Blockchain gehen jedoch weit über reine Sicherheitsaspekte von Netzwerken hinaus: Ihre Struktur ermöglicht eine echte Dezentralisierung und lässt Akteure in den direkten Austausch treten. Eine Textnachricht, die man an seinen Sitznachbarn sendet, muss heute oft tausende von Kilometern zurücklegen, um im zentralen Server aktualisiert zu werden und schließlich in der App des Nachbarn zu erscheinen. Es mag unwirklich klingen, aber zwei benachbarte Geräte wissen nicht unbedingt, dass sie benachbart sind – daher kann nur der Server ihren Austausch koordinieren. Für den autonom fahrenden Verkehr der Zukunft ist das Wissen weiterer Akteure in der unmittelbaren Umgebung jedoch essenziell. Das Fahrzeug muss wissen, mit wem und wie es interagiert: beim Tanken, Parken oder der Nutzung von Car Sharing-Services. Eine Infrastruktur, welche die direkte Kommunikation zwischen Fahrzeugen oder dem Fahrzeug und der Tanksäule, also „Machine to Machine“ ermöglicht, ist dabei wesentlich effizienter und eröffnet weitere Optionen des „nahtlosen“ Austauschs. Die Blockchain bietet damit die technologische Basis für ein echtes Internet der Dinge.

Von künstlicher Intelligenz zur kollektiven Intelligenz

Kritiker der Blockchain weisen völlig zu Recht darauf hin, dass die lebendigen Zukunftsszenarien von selbstfahrenden Autos und smarten Städten mit der vorhandenen Technologie bewältigt werden können. Wenn wir uns allerdings eine tief vernetzte Zukunft vorstellen, bei der jedes elektronische Gerät ein Akteur im Internet ist, so wird nicht nur die erforderliche Bandbreite zur Datenübertragung um ein Vielfaches ausgebaut werden müssen: Vor allem auch die Anzahl und Kapazität der Datenzentren, welche die eigentliche Rechenarbeit hinter diesem Internet der Dinge leisten, wird signifikant wachsen müssen – und dies bedeutet gleichzeitig eine zunehmende Zentralisierung, die Entstehung noch mächtigerer Datenmonopole und im Ergebnis die Herrschaft von riesigen Black Box-Modellen. Die Lösung ist so simpel wie elegant: Blockchain bietet eine Infrastruktur, die auf Peer to Peer-Kommunikation zwischen den Geräten basiert. Diese erlaubt – ähnlich wie in der physischen Welt – die freie Bewegung durch das fragmentierte Internet, ohne sich einloggen zu müssen. Dabei unterliegen die Daten vollständig der persönlichen Kontrolle und es werden jeweils nur die Informationen zur Verfügung gestellt, die für den individuellen Vorgang benötigt werden – kein Bit mehr. Beispiele sind etwa die Übertragung von personenbezogenen Daten oder die Erlaubnis von Appzugriffen. Für Geräte ist es der Aufbruch in eine autonome Zukunft, in der ein Auto mit der Parklücke die Parkdauer und Parkgebühr aushandelt und das Smartphone automatisch das günstigste Bahnticket für die Reise erwirbt. Es ist eine Zukunft, in der die digitale Welt die sonderbaren und umständlichen Verhaltensformen ablegt, an die wir uns schon so sehr gewöhnt haben – etwa das immer wiederkehrende Eintippen von Benutzername und Passwort. Die digitale und die physische Welt verschmelzen und der Nutzer behält dabei die Kontrolle.

Fazit

Diese blockchainbasierte Infrastruktur ist radikal neu und bisher kaum den Kinderschuhen entwachsen – aber sie bietet einen fruchtbaren, gesunden Boden für die Entwicklung eines neuen, nutzerzentrierten und dezentralen Internets: eines Internets, in dem die künstliche Intelligenz nicht in einer Sackgasse sich selbst verstärkender, intransparenter Filterblasen endet, sondern eines, wo das scharfe Auge der KI und die Dezentralisierung durch Blockchain zu einer neuen Intelligenz konvergieren. Das ist das World Wide Web der kollektiven Intelligenz.

 

Dr. Georg Stricker ist Tech Lead bei Signature Ventures und in dieser Rolle für die technische Due Diligence sowie für die Arbeit mit Gründern verantwortlich. Die Forschungsarbeiten des promovierten Informatikers und Statistikers umfassten Methoden statistischer Inferenz und des maschinellen Lernens, bevor künstliche Intelligenz einmal mehr zum Modewort aufstieg. Durch die umfangreiche Arbeit mit großen Datenmengen wurde er auf die Blockchain-Technologie aufmerksam. Seit 2013 ist er aktives Mitglied der Blockchain-Community. Juliane Schiefer ist Founding- und Managing Partner von Signature Ventures. Signature Ventures ist ein Early Stage Venture Capital Fund, der auf Investments in Start-ups spezialisiert ist, die mittels Blockchain-Technologie und Dezentralisierung das Fundament für die nächste Phase des Internets legen. Signature Ventures hat Büros in München und Berlin und investiert weltweit mit Fokus auf europäische Equity-Investments. Über ihre Rolle als Partner hinaus ist sie aktiv als Business Angel und Advisor tätig. Zuvor leitete sie die Investmentarme zweier börsennotierter Konzerne.