Grundlagen in Kürze
Wie funktioniert KI? - "Swiss Cheese Modell" und "Neuronale Netze"
Ein neuronales Netzwert ist sozusagen:
Ein "siebenmaliges" Durchsieben von Informationen, wobei jede Sieb die Information etwas anders sortiert, bis am Ende nur das durchkommt, was am wahrscheinlichsten passt. Dies ist auch als "Swiss Cheese Model" bekannt:
(Effektiv hat es in einer modernen KI 400 oder Layers, mit je 50 - 200 Millionen Parametern)
Wie werden Informationen gespeichert? - In Vektor-Datenbanken, ähnlich wie im Gehirn:
biologisch/elektronisch visuell ---------------> digital
Data Vector Embeddings/Vector Data
Mensch: organische Hinrzellen mit Synapsen
KI: vektorielle Datenbank -> digitale Repräsention der Verbindungen und der "Nähe" der einzelnen Punkte
Wie werden Textantworten in LLMs erzeugt?
Ein Large Language Model (LLM) verarbeitet Text nicht in ganzen Wörtern, sondern in Tokens (Wortfragmenten). Der Prozess funktioniert wie folgt:
-
Tokenisierung: Dein Text wird in kleine Einheiten (Tokens) zerlegt und in mathematische Vektoren umgewandelt.
-
Wahrscheinlichkeitsrechnung: Die KI analysiert den Kontext und berechnet für jedes mögliche Token in ihrem Vokabular eine Wahrscheinlichkeit.
-
Vorhersage: Sie wählt das wahrscheinlichste nächste Token aus und fügt es der Antwort hinzu.
-
Autoregression: Dieser Vorgang wiederholt sich iterativ (mehrmals): Das neue Token wird Teil des Inputs, um das darauf folgende Token zu bestimmen, bis die Antwort fertig ist.
Hier ist ein einfaches Beispiel, wie eine KI die Wahrscheinlichkeiten für das nächste Token berechnet.
Ein Satz Satz beginnt mit: "Der Himmel ist..."
| Token-Kandidat | Wahrscheinlichkeit |
| blau | 85% |
| bewölkt | 10% |
| weit | 3% |
| Banane | 0,001% |
Hier sieht man, wie ein LLM diese Wörter in Tokens zerlegt:
„Du läufst schnell.“
Die KI sieht den Satz oft so zerstückelt:
-
Du (einzelnes Token)
-
lä + ufst (das Verb wird in Stamm und Endung getrennt: zwei Token)
-
schnell (einzelnes Token)
-
. (Satzzeichen sind oft eigene Tokens)
Wie werden KI-Bilder erzeugt?
Ein KI-Bildgenerator wie Nano Banana verwendet komplexe Algorithmen, oft basierend auf tiefen neuronalen Netzen. Diese Modelle werden mit riesigen Datensätzen von Bildern und deren Beschreibungen trainiert.
Im Wesentlichen lernt die KI, Muster, Stile und Merkmale in diesen Daten zu erkennen. Wenn du eine Textbeschreibung eingibst, interpretiert die KI diese und erzeugt ein völlig neues Bild, das zu deiner Beschreibung passt, indem sie die gelernten Muster kreativ kombiniert.
Hier ist eine Illustration dazu:
Text-Input passende Elemente werden gesucht Bild wird daraus erstellt