Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
| ef:ki:llm [2026/04/23 10:48] – emmeneggerg | ef:ki:llm [2026/04/23 12:32] (aktuell) – [5. GPUs] emmeneggerg | ||
|---|---|---|---|
| Zeile 69: | Zeile 69: | ||
| {{ : | {{ : | ||
| //Bild: Wie frühere Modelle Sätze bearbeiten und wie Transformer dies tun.// | //Bild: Wie frühere Modelle Sätze bearbeiten und wie Transformer dies tun.// | ||
| - | |||
| Da ein Transformer nicht direkt mit rohem Text arbeiten kann, wird dieser zunächst in Tokens zerlegt (Tokenisierung). Anschliessend werden die Tokens in sogenannte Vektoren umgewandelt, | Da ein Transformer nicht direkt mit rohem Text arbeiten kann, wird dieser zunächst in Tokens zerlegt (Tokenisierung). Anschliessend werden die Tokens in sogenannte Vektoren umgewandelt, | ||
| + | {{ : | ||
| + | //Bild: Beispiel wie Wörter als Embeddings dargestellt werden// | ||
| Der Transformer besteht aus wiederkehrenden Schichten von Attention-Mechanismen und FNN. | Der Transformer besteht aus wiederkehrenden Schichten von Attention-Mechanismen und FNN. | ||
| Zeile 92: | Zeile 93: | ||
| Die Daten durchlaufen mehrfach diese Schichten, wodurch das Modell schrittweise ermittelt, welche Informationen entscheidend sind, um das nächste Token vorherzusagen. | Die Daten durchlaufen mehrfach diese Schichten, wodurch das Modell schrittweise ermittelt, welche Informationen entscheidend sind, um das nächste Token vorherzusagen. | ||
| + | {{ : | ||
| + | |||
| Am Ende dieses Prozesses wird der letzte Vektor vorhergesagt, | Am Ende dieses Prozesses wird der letzte Vektor vorhergesagt, | ||
| {{ : | {{ : | ||
| - | |||
| //Bild: Beispiel, wie sich Vektoren beeinflussen, | //Bild: Beispiel, wie sich Vektoren beeinflussen, | ||
| Zeile 104: | Zeile 106: | ||
| Um LLMs herzustellen, | Um LLMs herzustellen, | ||
| - | {{ : | + | {{ : |
| ===== 6. Grenzen und Probleme von LLMs ===== | ===== 6. Grenzen und Probleme von LLMs ===== | ||
| * LLMs erfordern erhebliche Ressourcen für Entwicklung und Training. Häufig werden grössere Modelle auf bereits bestehenden Basismodellen aufgebaut, die ein grundlegendes Sprachverständnis besitzen. | * LLMs erfordern erhebliche Ressourcen für Entwicklung und Training. Häufig werden grössere Modelle auf bereits bestehenden Basismodellen aufgebaut, die ein grundlegendes Sprachverständnis besitzen. | ||
| + | * LLMs verstehen nichts im menschlichen Sinne. Sie haben Probleme mit logischen Schlussfolgerungen, | ||
| * Da LLMs auf Wahrscheinlichkeiten basieren, können sie Antworten erzeugen, die überzeugend wirken, jedoch faktisch falsch sind. Diese bezeichnet man als Halluzinationen. | * Da LLMs auf Wahrscheinlichkeiten basieren, können sie Antworten erzeugen, die überzeugend wirken, jedoch faktisch falsch sind. Diese bezeichnet man als Halluzinationen. | ||
| * Selbst wenn die LLM durch Transformer riesige Teile des Textes beachten, bleibt die Kapazität endlich. Das LLM kann nur Informationen anschauen, welche in einem begrenzten Kontextfenster liegen. Dies führt dazu, dass frühere Gesprächsteile vergessen werden oder Zusammenhänge verloren gehen. Dies passiert insbesondere bei sehr langen Argumentationen. | * Selbst wenn die LLM durch Transformer riesige Teile des Textes beachten, bleibt die Kapazität endlich. Das LLM kann nur Informationen anschauen, welche in einem begrenzten Kontextfenster liegen. Dies führt dazu, dass frühere Gesprächsteile vergessen werden oder Zusammenhänge verloren gehen. Dies passiert insbesondere bei sehr langen Argumentationen. | ||
| - | * LLMs verstehen nichts im menschlichen Sinne. Sie haben Probleme mit logischen Schlussfolgerungen, | ||
| * Da LLMs mit menschengemachten Texten trainiert werden, können Vorurteile aus den Trainingsdaten übernommen werden. Es entstehen Verzerrungen (Bias). Siehe 6. Gruppe. | * Da LLMs mit menschengemachten Texten trainiert werden, können Vorurteile aus den Trainingsdaten übernommen werden. Es entstehen Verzerrungen (Bias). Siehe 6. Gruppe. | ||
| * Zudem ist das Wissen eines LLMs in der Regel auf den Trainingszeitraum beschränkt und wird nicht automatisch aktualisiert. Dadurch fehlen Informationen über aktuelle Entwicklungen oder neue wissenschaftliche Erkenntnisse. | * Zudem ist das Wissen eines LLMs in der Regel auf den Trainingszeitraum beschränkt und wird nicht automatisch aktualisiert. Dadurch fehlen Informationen über aktuelle Entwicklungen oder neue wissenschaftliche Erkenntnisse. | ||