Generative KI

Von Chatbots und Deep Learning

Ein kleiner Roboter sitzt auf einem Smartphone, umringt von Textblasen.

Die Veröffentlichung des Textgenerators ChatGPT hat für Aufsehen gesorgt. Die Künstliche Intelligenz, die in Sekundenbruchteilen Texte erstellen kann und Fragen beantwortet, war mit einem Mal für eine breite Öffentlichkeit nutzbar. Seither ist die Begeisterung für generative KI ungebrochen. Wir stellen vor, was sich hinter generativer KI verbirgt und was sie kann.


Generative Künstliche Intelligenz (KI) ist ein Bereich der KI-Technologien, die darauf spezialisiert sind, verschiedene Arten von Inhalten zu erstellen, insbesondere Texte, Bilder, Videos und Musik. Das besondere, die Inhalte erscheinen menschenähnlich oder gar kreativ. Diese  KI-Systeme verwenden oft künstliche neuronale Netzwerke, um aus einer großen Menge von Trainingsdaten zu lernen und dann neue Inhalte zu generieren, die auf diesen Daten basieren.

Künstliche neuronale Netze:
In einem künstlichen neuronalen Netz ahmen künstliche Neuronen durch Algorithmen die Nervenzellen des Gehirns nach. Die künstlichen Neuronen funktionieren als Knotenpunkte, die miteinander vernetzt sind. Die Verknüpfung der künstlichen Neuronen wird beim „Lernen“ jeweils angepasst, um das beste Ergebnis für die jeweilige Aufgabe zu erzielen.

Künstliche Neuronale Netzwerke (KNN) sind ein wichtiger Bestandteil von generativer KI. Sie ermöglichen es, dass die KI „lernt“. Die Methode des maschinellen Lernens auf der künstliche neuronale Netzwerke beruhen, wird „Deep Learning“ (tiefes oder mehrschichtiges Lernen) genannt. Zwischen den Datenknotenpunkten, den Neuronen können viele Verbindungsschichten liegen, die verborgenen Schichten (Hidden Layers). Große Datenmengen, Texte, Töne oder Bilder werden wiederholt nach Mustern und besonderen Merkmalen untersucht. Die Daten werden statistisch analysiert, um die beste Vorhersage für das Ergebnis zu treffen. Der Prozess des Deep Learning läuft automatisiert ab. Die neuronalen Netze werden stetig verfeinert, wenn eine neue Dateneingabe erfolgt. Auf diese Weise entwickelt sich die KI weiter.

Es gibt verschiedene Formen von generativer KI im Internet:

Textgenerierung: Textgenerierende Modelle wie GPT (Generative Pre-trained Transformer) können menschenähnlichen Text erstellen. Sie werden für Aufgaben wie Textzusammenfassungen, Übersetzungen, Chatbots und das Verfassen von Artikeln verwendet.

Chatbot:
Textbasiertes Dialogsystem, das Chatten mit einem technischen System erlaubt.

Zu den bekanntesten textgenerierungs KI-Systemen zählen ChatGPT von OpenAI und Google Bard. Beide Systeme basieren auf sogenannten Sprachmodellen, Large Language Models (LLMs). Die Datenbasis mit der die beiden KI-Anwendungen trainiert wurden, ist das Internet.

Sprachmodelle funktionieren aufgrund statistischer Wahrscheinlichkeiten. Sie können durch „Training“ sprachlich korrekte Texte erstellen und Antworten geben, diese folgen allerdings nicht immer den Fakten.  Sowohl die Eingabe als auch die Ausgabe erfolgt bei KI-Systemen zur Textgenerierung (Text-to-Text Modelle) mit natürlicher Sprache. Der geschriebene Arbeitsauftrag wird Prompt genannt.

Bildgenerierung: Generative adversarial networks (GANs) sind eine Art von KI-Modell, die Bilder erstellen kann. Sie bestehen aus einem Generator, der Bilder erzeugt, und einem Diskriminator, der beurteilt, wie realistisch die Bilder sind. GANs werden in der Kunst, der Medienproduktion und der Bildbearbeitung eingesetzt. Zu den bekannten Bild-Erstellungssoftware unter Verwendung von KI gehört Dall-E von OpenAI, die auch ChatGPT bereitstellen. Dieses Programm steht bisher nur in englischer Sprache zur Verfügung. Ebenso das Programm Midjourney. Beide KI-Programme können nur unter vorheriger Registrierung genutzt werden.

Musikgenerierung: KI-Modelle können auch Musik auf verschiedene Weisen generieren. Sie können Musikstücke komponieren, Begleitmusik erstellen oder sogar Songtexte schreiben. Diese Modelle finden Anwendung in der Musikindustrie und in der Medienproduktion. Wer mehr darüber erfahren möchte, wie mit KI Musik generiert wird, der kann das auch selbst ausprobieren mit Piano Genie von Imaginary open mathematics. Gleichzeitig wird erklärt, wie die KI von Piano Genie funktioniert.

Videogenerierung: KI kann auch Videos generieren, sei es durch das Zusammenstellen und Bearbeiten von vorhandenem Videomaterial oder durch das Erstellen von Animationen und Effekten. Dies wird in der Filmproduktion, der Werbung und der Unterhaltungsindustrie genutzt. Aktuell gibt es eine Vielzahl von KI-Anwendungen, die aus Bildern Videos generieren können. Die meisten dieser KI-Tools (englisch für Dienstprogramme) sind kostenpflichtig und englischsprachig.

Gesichts- und Sprachsynthese: Einige KI-Systeme können Gesichter erzeugen, indem sie realistisch aussehende Bilder von Personen erstellen. Sie können auch menschenähnliche Stimmen generieren. In der Weiterentwicklung von ChatGPT in der Version GPT-4 kann Text in Sprache umgewandelt werden. Diese Version ist kostenpflichtig nutzbar. Die Technologien zur Gesichts- und Sprachsynthese haben vielfältige Anwendungen, von der Filmproduktion bis hin zur Erstellung von Avatar-Bildern. Wer einmal ausprobieren möchte, wie KI-basierte Gesichtserkennung mit der Kamera des eingenen Smartphones oder Computers funktioniert, findet dazu eine Anleitung bei „KI für ein gutes Alter“.

Datenschutz und Urheberrechte
Der Datenschutz bei einigen KI-Apps kann mitunter bedenklich sein. Es ist wichtig, die Auswirkungen auf die Privatsphäre genau zu prüfen. Bei der Nutzung kostenloser Apps zahlt man möglicherweise nicht mit Geld, sondern mit persönlichen Daten. Darüber hinaus ist es ratsam, die Geschäftsbedingungen (AGBs) sorgfältig zu prüfen, da man in manchen Fällen sein Urheberrecht abgibt. Einige KI-Plattformen behalten sich in ihren Nutzungsbedingungen das Recht vor, die generierten Inhalte für ihre eigenen Zwecke zu verwenden. Eine kritische Auseinandersetzung mit den Datenschutzrichtlinien und Nutzungsbedingungen ist unerlässlich, um eine informierte Entscheidung über die Nutzung von KI-Apps und Plattformen zu treffen.

Quellen und weiterführende Links:
Universität Köln: Was ist generative künstliche Intelligenz?
Fraunhofer IAO: Spielarten künstlicher Intelligenz
MDR: KI und neuronale Netzwerke
ChatGPT von OpenAI
DALL-E von OpenAI
Bard von Google
Bilderstellung mit Midjourney
Künstliche Intelligenz erklärt/Piano Genie
KI für ein gutes Alter

Dieser Artikel gibt den Sachstand zum Zeitpunkt der Veröffentlichung wieder. Datum: 29. November 2023