Blogbeitrag von
Maxim Perl, Cassini Consulting, Spezialist für Künstliche Intelligenz
Maxim Perl
Management Consultant
Generative AI
Generative AI

Generative AI: Generative Künstliche Intelligenz im Überblick

Diesen Begriff hat jeder schon gehört: „Artificial Intelligence“ (AI) oder im Deutschen „Künstliche Intelligenz“ (KI). Spätestens mit der Einführung von ChatGPT Ende 2022 rückte die generative AI ins öffentliche Interesse. Und Generative KI wird im Alltag zunehmend wichtiger, da sie einer breiten Masse zugänglich ist. Aber was ist der Unterschied zwischen AI und Generative AI? Welche KI-Entwicklungen können wir in der Zukunft erwarten?  

Was bedeutet „Artificial Intelligence“?

Künstliche Intelligenz ist ein Teilbereich der Informatik. KI funktioniert zwar mit einem Algorithmus, enthält aber keinen festen Lösungspfad: Vielmehr lernt die Künstliche Intelligenz eigenständig, um Aufgaben selbstständig zu bearbeiten und sich dabei flexibel an unbekannte Situationen anzupassen. Das heißt, Künstliche Intelligenz ist eine Technologie, die menschliche Fähigkeiten wie Denken, Lernen, Planen und Lösen von Problemen nachahmt und versucht, humane Lern- und Denkprozesse in Software zu übertragen. Artificial Intelligence ist also ein Computerprogramm, das mit neuronalen Netzen die Informationsverarbeitung des Gehirns imitiert:  

  • Zuerst werden riesige Datenmengen wie Texte, Bilder, Videos oder Sprache als Input in das System eingespeist. Die KI erfasst und organisiert diese Daten und nutzt sie als Trainingsdaten.
  • Anschließend verarbeitet ein Algorithmus diese Daten im System. Ein Algorithmus besteht im Grunde aus einer Reihe von Anweisungen, um eine Aufgabe zu erfüllen oder ein Problem zu lösen.
  • Während der Verarbeitung lernt die KI, Muster zu erkennen und aus Fehlern zu lernen, um sich zu verbessern. Das ist das sogenannte Machine Learning
  • Zum Schluss erzeugt die KI daraufhin einen Daten-Output, wie ein generiertes Bild oder einen Text. Daten, die von Rechenalgorithmen geschaffen werden, nennt man auch synthetische Daten. Diese können dann beispielsweise als synthetische Testdaten verwendet werden.

Welche vier Arten von künstlicher Intelligenz gibt es?

Das Navigationssystem im Auto, der Empfehlungsalgorithmus im Onlineshop oder die Gesichtserkennung auf dem Smartphone: KI-Technologie ist allgegenwärtig. Viele von uns sind mit dem Konzept der schwachen KI vertraut. Die starke KI, eine „Superintelligenz“, die wie ein Mensch denken kann, ist noch reine Zukunftsvision. Doch die Weiterentwicklungen in der Generative AI, wie ChatGPT als Sprachmodell, bedeuten in der KI-Forschung einen großen Sprung nach vorn.  

KI lässt sich in vier Gruppen einteilen, je nach ihrem Potenzial, die Welt wahrzunehmen, sich an Erfahrungen zu erinnern und sich durch maschinelles Lernen zu verbessern. Diese Fähigkeiten bestimmen, ob eine KI schwach oder stark ist:

  • Schwache KI ist methodisch: Diese Art von KI konzentriert sich auf eine einzige Aufgabe und kann ihre Fähigkeiten nicht auf andere Bereiche übertragen. Kreativität fehlt ihr gänzlich. Ihre Lernmöglichkeiten beschränken sich auf das Training zur Mustererkennung oder das Durchsuchen und Abgleichen von großen Datenmengen.
  • Starke KI existiert noch nicht: Diese Art von KI wäre in der Lage, selbst Aufgaben zu erkennen und zu definieren sowie sich eigenständig das nötige Wissen im jeweiligen Anwendungsbereich anzueignen.

Die vier Gruppen von Artificial Intelligence

Typ 1: Reaktive Maschinen

Das ist die schwächste Form der KI. Sie reagiert auf einzelne Probleme mit vorprogrammierten Algorithmen. Sie kann keine vergangenen Erfahrungen zur Entscheidungsfindung nutzen.

Einsatzmöglichkeiten und Beispiele:
IBM Schachcomputer DeepBlue aus dem Jahr 1997

Typ 2: KI mit begrenzter Speicherkapazität (Limited Memory)

KI-Systeme mit begrenzter Speicherung sind zurzeit der am weitesten verbreitete Stand der KI. Sie lernen aus alten Daten und fügen diese Erfahrungen zu ihrem Entscheidungsprozess hinzu.

Einsatzmöglichkeiten und Beispiele:
Selbstfahrende Autos, Chatbots, persönliche Smartphone-Assistenten u.v.m.

Typ 3: Theorie des Geistes (Theory of Mind)

Diese theoretische KI-Form könnte eine Vorstellung von unserer Welt haben, menschliche Emotionen und Gedanken verstehen und darauf reagieren.

Einsatzmöglichkeiten und Beispiele:
Keine Anwendung

Typ 4: KI mit Selbsterkenntnis

Diese Form der KI besitzt ein Bewusstsein über sich selbst und kann eigene Gefühle, Bedürfnisse und Wünsche verstehen. Sie ist eine Zukunftsvision.

Einsatzmöglichkeiten und Beispiele:
Keine Anwendung

Hinweis: Die KI-Formen drei und vier gibt es noch nicht, da Gefühle, Gedanken und menschliches Verhalten technisch schwer bis kaum nachzubilden sind.

Generative AI: Definition und Erklärung

Was ist der Unterschied zwischen AI und Generative AI? Die Generative AI, also die generative KI, lässt sich als eine Unterform der allgemeinen künstlichen Intelligenz definieren. Sie ist ein KI-Modell, das eigenständig neue Inhalte erzeugt, die zu den Daten passen, mit denen es vorher trainiert wurde. Das sind zum Beispiel Texte, Bilder, Videos, Code, 3D-Modelle, Sprache oder Musik. Damit unterscheidet sich generative KI von der diskriminativen KI: Bei einem Diskriminator-KI-Modell werden vorhandene Datensätze klassifiziert und interpretiert, wie zum Beispiel die Spracherkennung „Alexa“. Es kann aber keine neuen Inhalte erstellen.

So lassen sich mit Generative AI neue, realistische Inhalte erstellen: Ein Nutzer tippt zum Beispiel eine Anweisung („Prompt“) in ein GenAI-Tool ein – und die KI antwortet mit kreativen, synthetischen Inhalten und Daten. Dies kann zum Beispiel ein Bild, das durch die Daten berühmter Kunstwerke inspiriert wurde, oder ein Text im Stil eines bekannten Schriftstellers sein. Damit ist ChatGPT eine generative KI. Der textbasierte Chatbot wurde mit einer enormen Datenmenge aus dem Internet trainiert, um ein Modell zu schaffen, das auf Befehl neue AI-Texte erzeugt.

Generative AI-Tools: Eine Übersicht

Es gibt zahlreiche generative AI-Tools auf dem Markt. Die bekanntesten sind:

Text-Generierung

ChatGPT von OpenAI, Neuroflash, Jasper, Copy.ai

Hinweis:
AI-Texte werden auf Basis von LLMs Large Language Models erzeugt.

Bild-Generierung

DALL-E 2 oder 3 von OpenAI als Bildgenerator, Midjourney, Neuroflash, Canva, Adobe Firefly, ImageAI

Hinweis:
Aus einer textlichen Beschreibung wird ein Bild generiert.

Video-Generierung

Synthesia, Make-A-Video (von Meta), X-Clip (von Microsoft)

Hinweis:
Aus einer Texteingabe wird ein Video erstellt.

Programmcode-Generierung

OpenAI Codex, AlphaCode (DeepMind), ChatGPT, GitHub Copilot, Tabnine

Hinweis:
KI-Code-Generatoren unterstützen das Schreiben von Programmcode.

Sprach-Generierung

Fliki, ElevenLabs, Murf.ai, PlayHT, Speechify

Hinweis:
Mit einem KI-Sprachgenerator wird Text in gesprochene Sprache umgewandelt.

Die Zukunft von Generative AI: Trends und Entwicklungen

KI und Generative AI haben viele Vorteile, vor allem das Automatisieren von Aufgaben, die bisher manuell ausgeführt wurden. In den nächsten Jahren wird KI deshalb am Arbeitsplatz immer wichtiger werden und viele Arbeitsprozesse tiefgreifend verändern. Denn Künstliche Intelligenz und Generative AI sind in der Lage, die Effizienz in nahezu jeder Branche erheblich zu steigern: vom Planen energiesparender Maßnahmen in der Baubranche und Entwickeln von Bauplänen in der Architektur über das Kreieren von Designs für die Modebranche und Erstellen von Content in den Sozialen Netzwerken bis hin zum Schreiben von Unterrichtsmaterialien und vieles mehr.

Sie hat jedoch auch Schattenseiten, darunter die Tendenz zur Voreingenommenheit und die sogenannten KI-Halluzinationen, bei denen die KI frei erfundene Inhalte erschafft. Daher gilt es, den korrekten Umgang mit generativer KI zu sensibilisieren. Parallel dazu werden die ethische Bewertung und die Diskussion über eine Regulierung von KI notwendig werden.