Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- ef:ki:bild [2026/03/19 15:40] – baechlerl
+++ ef:ki:bild [2026/04/22 09:34] (aktuell) – [Was ist generative KI?] baechlerl
@@ Zeile 1: / Zeile 1: @@
 ====== Bild- und Videogeneratoren mit KI ======
-Diese Seite erklärt, wie KI-gestützte Bild- und Videogeneratoren funktionieren – von den Grundbegriffen über die technischen Hintergründe bis zu gesellschaftlichen Risiken.
+Stell dir vor, du schreibst „ein futuristisches Zürich bei Nacht“, und eine KI erzeugt daraus in wenigen Sekunden ein realistisches Bild oder sogar ein Video.
+Genau das machen moderne Bild und Videogeneratoren.
+Diese Seite erklärt, wie solche Systeme funktionieren, von den Grundbegriffen über die technischen Hintergründe bis zu den wichtigsten gesellschaftlichen Fragen.
 <WRAP tip>
@@ Zeile 11: / Zeile 13: @@
 ==== Was ist generative KI? ====
-Normale KI-Programme erkennen Dinge – zum Beispiel, ob auf einem Foto eine Katze zu sehen ist. Generative KI macht etwas anderes: Sie erzeugt neue Inhalte, also etwa ein Bild, das es vorher noch nicht gab. Das Programm lernt dazu aus sehr vielen Beispielen, welche Bilder, Texte oder Videos „typisch" aussehen – und kann dann selbst neue erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
+<wrap 100px>{{ :ef:ki:screenshot_2026-04-22_084555.png}}</wrap>
-Bild- und Videogeneratoren sind eine Art generativer KI. Man gibt ihnen eine Textbeschreibung (den sogenannten Prompt) – und sie erzeugen daraus ein passendes Bild oder Video.((Ultralytics: Diffusionsmodelle – Generative AI erklärt. https://www.ultralytics.com/de/blog/what-are-diffusion-models-a-quick-and-comprehensive-guide))
+Normale KI-Programme erkennen Dinge wie zum Beispiel, ob auf einem Foto eine Katze zu sehen ist. Generative KI macht etwas anders. Sie erzeugt neue Inhalte, wie beispielsweise ein Bild, das es vorher noch nicht gab. Das Programm lernt dazu aus sehr vielen Beispielen. Welche Bilder, Texte oder Videos "typisch" aussehen und kann dann selbst neue erzeugen, die ähnlich wirken.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
+Bild- und Videogeneratoren sind eine Art generative KI. Man gibt ihnen eine Textbeschreibung (den Prompt) und sie erzeugen daraus ein passendes Bild oder Video.((Ultralytics: Diffusionsmodelle – Generative AI erklärt. https://www.ultralytics.com/de/blog/what-are-diffusion-models-a-quick-and-comprehensive-guide))
 ^ Begriff ^ Erklärung ^
@@ Zeile 19: / Zeile 23: @@
 | Seed | Eine Zahl, die den Zufallsstart festlegt. Mit demselben Seed und Prompt bekommt man immer dasselbe Bild |
 | Latenter Raum | Eine stark vereinfachte, interne Darstellung des Bildes, mit der das Modell rechnet |
-| Training | Das Lernen des Modells aus sehr vielen Beispielbildern – passiert einmal, bevor man das Tool nutzt |
+| Training | Das Lernen des Modells aus sehr vielen Beispielbildern. Das passiert einmal, bevor man das Tool nutzt |
-| Inference | Die eigentliche Nutzung: Man gibt einen Prompt ein und das fertig trainierte Modell erzeugt das Bild |
+| Inference | Die eigentliche Nutzung. Man gibt einen Prompt ein und das fertig trainierte Modell erzeugt das Bild |
 ==== Was macht einen guten Prompt aus? ====
@@ Zeile 37: / Zeile 41: @@
 ==== Trainingsdaten ====
-Damit ein Bildgenerator lernen kann, braucht er sehr viele Beispiele. Beim Training sieht das Modell Millionen von Bildern zusammen mit Textbeschreibungen dazu. Das Modell lernt so, was Wörter wie „Hund" oder „Sonnenuntergang" visuell bedeuten.((Digitalzentrum Franken: KI-Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion))
+Damit ein Modell Bilder erzeugen kann, braucht es sehr viele Beispiele.
+Beim Training sieht es Millionen von Bildern zusammen mit passenden Textbeschreibungen.
+So lernt das Modell, was Begriffe wie „Hund“ oder „Sonnenuntergang“ visuell bedeuten.((Digitalzentrum Franken: KI Bildgenerierung mit Stable Diffusion. https://digitalzentrum-franken.de/aktuelles/detail/ki-bildgenerierung-mit-stable-diffusion))
@@ Zeile 43: / Zeile 49: @@
 <WRAP info>
-Dieser Abschnitt erklärt, was im Hintergrund passiert. Man muss kein Mathematik-Experte sein – es reicht, das Grundprinzip zu verstehen.
+Dieser Abschnitt erklärt die wichtigsten Ideen im Hintergrund. Es geht um ein grundlegendes Verständnis, nicht um Details.
 </WRAP>
 ==== Neuronale Netze ====
-Ein neuronales Netz ist eine Art Computerprogramm, das dem menschlichen Gehirn nachempfunden ist. Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind. Beim Training werden diese Verbindungen so angepasst, dass das Netz die gewünschten Ausgaben erzeugt. Bei Bildgeneratoren ist das Ziel nicht, etwas zu erkennen, sondern etwas Neues zu erschaffen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
+Ein neuronales Netz ist ein Computerprogramm, das grob vom menschlichen Gehirn inspiriert ist.
+Es besteht aus vielen kleinen Recheneinheiten, die miteinander verbunden sind.
+Beim Training werden diese Verbindungen so angepasst, dass das Netz sinnvolle Ergebnisse erzeugt, in diesem Fall neue Bilder.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
 ==== Transformer und Attention ====
-Transformer sind eine bestimmte Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen – zum Beispiel, dass die Wörter „sonnige Wiese" zusammengehören und bestimmte Bildmerkmale bedeuten. Der Mechanismus dahinter heisst Attention: Das Netz lernt, welche Teile der Eingabe gerade wichtig sind.((dogado KI-Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle))
+Transformer sind eine spezielle Art von neuronalen Netzen. Sie sind besonders gut darin, Zusammenhänge zu erkennen.
+Zum Beispiel versteht das Modell, dass „sonnige Wiese“ bestimmte Farben, Lichtverhältnisse und Objekte bedeutet.
+Der Mechanismus dahinter heisst Attention. Das Modell lernt dabei, welche Teile der Eingabe besonders wichtig sind.((dogado KI Lexikon: Diffusionsmodelle. https://www.dogado.de/ki-lexikon/diffusionsmodelle))
 ==== U-Net ====
-Viele ältere Bildgeneratoren benutzen eine Architektur namens U-Net. Das Netz macht das Bild zunächst kleiner und vereinfachter (Encoder), und baut es danach wieder in voller Grösse auf (Decoder). Diese Struktur eignet sich gut, um Bilder schrittweise zu verfeinern.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
+Viele ältere Bildgeneratoren benutzen eine Struktur namens U-Net. Das Netz macht das Bild zunächst kleiner und vereinfachter (Encoder), und baut es danach wieder in voller Grösse auf (Decoder). Diese Struktur eignet sich, um Bilder schrittweise zu verbessern und Details hinzuzufügen.((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
 ==== Variational Autoencoder (VAE) ====
@@ Zeile 64: / Zeile 75: @@
   - Decoder: Aus dieser kompakten Form wird das Bild wieder aufgebaut.
-Das klingt zunächst nutzlos, ist aber sehr praktisch: Das Modell muss nicht mit Millionen von Pixeln rechnen, sondern mit einer viel kleineren, komprimierten Darstellung. Das spart enorm viel Rechenleistung.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/))
+So muss das Modell nicht mit Millionen von Pixeln rechnen, sondern mit einer viel kleineren, komprimierten Darstellung. Das spart enorm viel Rechenleistung.((AWS: Was ist Stable Diffusion? https://aws.amazon.com/de/what-is/stable-diffusion/))
 ==== Diffusionsmodelle ====
-Diffusionsmodelle sind das Herzstück moderner Bildgeneratoren. Die Grundidee kommt aus der Physik: Wenn man einen Tintentropfen ins Wasser gibt, verteilt er sich langsam gleichmässig – das nennt man Diffusion. KI-Diffusionsmodelle machen das mit Bildern:((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
+Diffusionsmodelle sind das Herzstück moderner Bildgeneratoren. Die Grundidee kommt aus der Physik. Wenn man einen Tintentropfen ins Wasser gibt, verteilt er sich langsam gleichmässig, das nennt man Diffusion. KI-Diffusionsmodelle machen das mit Bildern:((IBM: Was sind Diffusionsmodelle? https://www.ibm.com/de-de/think/topics/diffusion-models))
   - Vorwärtsprozess: Ein echtes Bild wird schrittweise mit Rauschen überlagert, bis es nur noch zufällige Pixel zeigt.
   - Rückwärtsprozess: Das Modell lernt, diesen Prozess umzukehren – also aus Rauschen wieder ein sinnvolles Bild zu machen.
-  - Anwendung: Man beginnt mit purem Rauschen und lässt das Modell es Schritt für Schritt „bereinigen", geleitet durch den Prompt.
+  - Anwendung: Man beginnt mit purem Rauschen und lässt das Modell es Schritt für Schritt "bereinigen", geleitet durch den Prompt.
 <WRAP tip>
@@ Zeile 80: / Zeile 91: @@
 ==== Latent Diffusion Models (LDM) ====
-Diffusion direkt auf einem Bild in voller Auflösung wäre viel zu langsam. Die Lösung: Man führt die Diffusion nicht auf den Pixeln selbst durch, sondern im latenten Raum (also der komprimierten Darstellung des VAE). Das macht das Ganze bis zu 95 % schneller, ohne viel Qualität zu verlieren.((GuideGlare: Wie Diffusionsmodelle in der KI-Bilderzeugung funktionieren. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren))
+Diffusion direkt auf einem Bild in voller Auflösung wäre viel zu langsam. Um das zu lösen, führt man die Diffusion nicht auf den Pixeln selbst durch, sondern im latenten Raum (also der komprimierten Darstellung des VAE). Das macht das Ganze bis zu 95 % schneller, ohne viel Qualität zu verlieren.((GuideGlare: Wie Diffusionsmodelle in der KI-Bilderzeugung funktionieren. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren))
-Ausserdem wird der Textprompt über einen Mechanismus namens Cross-Attention in den Prozess eingebunden – so weiss das Modell, welches Bild es erzeugen soll. Das ist die Grundlage für Tools wie Stable Diffusion.
+Ausserdem wird der Textprompt über einen Mechanismus namens Cross-Attention in den Prozess eingebunden. So weiss das Modell, welches Bild es erzeugen soll. Das ist die Grundlage für Tools wie Stable Diffusion.
@@ Zeile 88: / Zeile 99: @@
 ^ Modelltyp ^ Wie es funktioniert ^ Bedeutung heute ^
-| GANs | Zwei Netze konkurrieren: eines erzeugt Bilder, das andere versucht, echte von falschen zu unterscheiden | War lange führend, heute für Text-to-Image weitgehend durch Diffusion ersetzt |
+| GANs | Zwei Netze konkurrieren. Eines erzeugt Bilder, das andere versucht, echte von falschen zu unterscheiden | War lange führend, heute für Text-to-Image weitgehend durch Diffusion ersetzt |
 | VAE | Encoder komprimiert, Decoder baut das Bild wieder auf | Wichtiger Baustein in modernen LDMs |
 | DDPM | Iteratives Entrauschen | Basis aller modernen Diffusionsmodelle |
 | LDM | Diffusion im latenten Raum + Textsteuerung | Grundlage von Stable Diffusion & Co. |
-| DiT | Transformer statt U-Net im Diffusionsmodell | Skaliert sehr gut; Basis neuerer Modelle wie FLUX und Sora |
+| DiT | Transformer statt U-Net im Diffusionsmodell | Skaliert sehr gut. Basis neuerer Modelle wie FLUX und Sora |
@@ Zeile 100: / Zeile 111: @@
 <WRAP box>
-  - Textverstehen: Der Prompt wird in eine Zahlen-Darstellung umgewandelt, die das Modell versteht.
+  - Textverstehen: Der Prompt wird in Zahlen umgewandelt
-  - Rauschen erzeugen: Aus einem Seed wird zufälliges Rauschen im latenten Raum erzeugt.
+  - Rauschen erzeugen: Zufälliges Rauschen wird erzeugt
-  - Schrittweises Entrauschen: Das Modell macht das Rauschen Schritt für Schritt weniger – gesteuert durch den Prompt.
+  - Schrittweises Entrauschen: Das Modell entfernt Schritt für Schritt das Rauschen
-  - Guidance: Ein Parameter namens Guidance Scale bestimmt, wie stark der Prompt das Ergebnis beeinflusst.
+  - Guidance: Der Prompt steuert den Prozess
-  - Dekodierung: Am Schluss rechnet der VAE-Decoder das Ergebnis in ein richtiges Pixelbild zurück.
+  - Dekodierung: Am Ende entsteht das Bild
 </WRAP>
@@ Zeile 117: / Zeile 128: @@
 ==== ControlNet ====
-Mit ControlNet kann man einem Diffusionsmodell zusätzliche Hinweise geben – zum Beispiel ein Kantenbild, eine Körperhaltung oder eine Tiefenkarte. Das Modell übernimmt dann die Struktur dieser Vorlage, aber erzeugt den Stil aus dem Prompt. So bekommt man viel mehr Kontrolle über Komposition und Aufbau des Bildes.((theblue.ai: Diffusionsmodelle – Eindrucksvolle Bilder mit Generative KI erstellen. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/))
+Mit ControlNet kann man einem Diffusionsmodell zusätzliche Hinweise geben, zum Beispiel ein Kantenbild, eine Körperhaltung oder eine Tiefenkarte. Das Modell übernimmt dann die Struktur dieser Vorlage, aber erzeugt den Stil aus dem Prompt. So bekommt man viel mehr Kontrolle über Komposition und Aufbau des Bildes.((theblue.ai: Diffusionsmodelle – Eindrucksvolle Bilder mit Generative KI erstellen. https://theblue.ai/blog-de/trends/diffusionsmodelle-generative-ki/))
 ===== 5. Video-Generatoren =====
-Video bedeutet „Bild + Zeit". Das macht die Aufgabe schwieriger, denn es reicht nicht, dass jedes einzelne Bild (Frame) gut aussieht.
+Video bedeutet "Bild + Zeit". Das macht die Aufgabe schwieriger, denn es reicht nicht, dass jedes einzelne Bild (Frame) gut aussieht.
 <WRAP important>
-Die einzelnen Bilder müssen zeitlich zusammenpassen. Figuren sollen nicht von Frame zu Frame ihr Gesicht verändern, und Bewegungen sollen flüssig wirken – das nennt man zeitliche Konsistenz.((DOCMA: Das Ende der Diffusion? Wie die neuen KI-Bildgeneratoren funktionieren. https://www.docma.info/blog/das-ende-der-diffusion-wie-die-neuen-ki-bildgeneratoren-funktionieren))
+Die einzelnen Bilder müssen zeitlich zusammenpassen. Figuren sollen nicht von Frame zu Frame ihr Gesicht verändern, und Bewegungen sollen flüssig wirken. Das nennt man zeitliche Konsistenz und gehört zu den grössten Herausforderungen, um solch ein Video zu generieren.((DOCMA: Das Ende der Diffusion? Wie die neuen KI-Bildgeneratoren funktionieren. https://www.docma.info/blog/das-ende-der-diffusion-wie-die-neuen-ki-bildgeneratoren-funktionieren))
 </WRAP>
@@ Zeile 133: / Zeile 144: @@
 | Video Diffusion | Direkte Erweiterung der Bilddiffusion auf mehrere Frames gleichzeitig |
 | Kaskaden-Ansatz | Zuerst ein grobes Video, dann wird es mit weiteren Modellen verfeinert und schärfer gemacht (z.B. Imagen Video) |
-| Make-A-Video | Das Modell lernt, wie Dinge aussehen, aus Bild-Text-Paaren – und wie sie sich bewegen, aus Videomaterial ohne Beschriftungen |
+| Make-A-Video | Das Modell lernt, wie Dinge aussehen, aus Bild-Text-Paaren und wie sie sich bewegen, aus Videomaterial ohne Beschriftungen |
 | Latent Video Diffusion | Video-Diffusion im latenten Raum, mehrstufiges Training (z.B. Stable Video Diffusion) |
-| Spacetime Patches | Videos werden in kleine Bausteine (Patches) über Raum und Zeit zerlegt und mit einem Transformer verarbeitet – so funktioniert Sora((DOCMA: Das Ende der Diffusion? Wie die neuen KI-Bildgeneratoren funktionieren. https://www.docma.info/blog/das-ende-der-diffusion-wie-die-neuen-ki-bildgeneratoren-funktionieren)) |
+| Spacetime Patches | Videos werden in kleine Bausteine (Patches) über Raum und Zeit zerlegt und mit einem Transformer verarbeitet – so funktioniert die KI Sora((DOCMA: Das Ende der Diffusion? Wie die neuen KI-Bildgeneratoren funktionieren. https://www.docma.info/blog/das-ende-der-diffusion-wie-die-neuen-ki-bildgeneratoren-funktionieren)) |
 ==== Tipps für Video-Prompts ====
-Bei Video-Prompts reicht eine reine Inhaltsbeschreibung oft nicht. Man sollte auch beschreiben, was sich bewegt und wie die Kamera sich verhält.
+Bei Video-Prompts reicht eine Inhaltsbeschreibung oft nicht. Man sollte auch beschreiben, was sich bewegt und wie die Kamera sich verhält.
   * Kamerabewegung angeben: //"langsam nach links schwenkend"// oder //"statische Kamera"//
@@ Zeile 160: / Zeile 171: @@
 ===== 7. Anwendungsbereiche =====
-KI-Bild- und Videogeneratoren werden heute in sehr vielen Bereichen eingesetzt:
+KI Bild und Videogeneratoren werden in vielen Bereichen eingesetzt. Um einen besseren Überblick zu behalten, kann man die Anwendungen in verschiedene Kategorien einteilen:
-  * Kreativbranche: Konzeptzeichnungen, Illustration, Werbung, Filmstoryboards
+==== Kreative Anwendungen ====
-  * Bildung: Anschauungsmaterial und Visualisierungen
-  * Forschung: Synthetische Trainingsdaten für andere KI-Modelle
-  * Industrie: Produktdesign, Architektur-Visualisierungen
-  * Unterhaltung: Spieleentwicklung, soziale Medien
+  * Kunst und Design: Unterstützung bei Ideen, Entwürfen und Visualisierungen
+  * Film und Medien: Erstellung von Storyboards, visuellen Effekten und Konzeptbildern
+  * Spieleentwicklung: Generierung von Figuren, Landschaften und Texturen
-===== 8. Risiken und gesellschaftliche Fragen =====
+==== Praktische und berufliche Anwendungen ====
-==== Deepfakes und Desinformation ====
+  * Architektur und Produktdesign: Realistische Visualisierung von Gebäuden und Objekten
+  * Marketing: Erstellung von Bildern und Videos für Werbung und soziale Medien
+  * Bildung: Veranschaulichung von komplexen Inhalten, z. B. historische Szenen oder wissenschaftliche Prozesse
-Generative Modelle können täuschend echte Bilder und Videos von realen Personen erzeugen – sogenannte Deepfakes. Der Begriff setzt sich aus „Deep Learning" und „Fake" zusammen. Das BSI (Bundesamt für Sicherheit in der Informationstechnik) warnt, dass damit Desinformationskampagnen durchgeführt, Personen verleumdet oder betrügerische Aktionen ermöglicht werden können.((BSI: Deepfakes – Gefahren und Gegenmassnahmen. https://www.bsi.bund.de/DE/Themen/Unternehmen-und-Organisationen/Informationen-und-Empfehlungen/Kuenstliche-Intelligenz/Deepfakes/deepfakes_node.html))
+==== Wissenschaft und Technik ====
-Laut einer Studie der IU Internationalen Hochschule (2025) wissen nur 34,3 % der Menschen in Deutschland, was Deepfakes überhaupt sind – obwohl fast alle Fake News kennen. Diese Wissenslücke ist gefährlich, denn Menschen können Deepfakes kaum von echten Videos unterscheiden.((IU Internationale Hochschule: Studie „Fakt oder Fake? Medienkompetenz in Deutschland". https://www.iu.de/news/grok-debatte-iu-studie-zeigt-deepfake-risiken-auf/))
+  * Forschung: Generierung von synthetischen Daten für das Training anderer KI Modelle
+  * Medizin: Simulationen und Visualisierungen, vor allem in Ausbildung und Forschung
-Die Bundeszentrale für politische Bildung (bpb) betont, dass Medienkompetenz deshalb immer wichtiger wird.((bpb: Deepfakes – Wenn man Augen und Ohren nicht mehr trauen kann. https://www.bpb.de/lernen/digitale-bildung/werkstatt/542670/deepfakes-wenn-man-augen-und-ohren-nicht-mehr-trauen-kann/))
+==== Alltag ====
-==== Herkunftsnachweise und Watermarking ====
+  * Private Nutzung: Erstellung von Bildern, Videos oder kreativen Projekten
+  * Social Media: Inhalte für Posts, Profile oder persönliche Projekte
-Als technische Gegenmassnahmen gibt es zwei Ansätze:
-  * C2PA ist ein Standard, der Herkunftsinformationen direkt in eine Datei einbettet. Man kann so nachverfolgen, wer ein Bild erstellt oder verändert hat.((C2PA: Content Credentials Technical Specification. https://c2pa.org/specifications/specifications/2.3/specs/C2PA_Specification.html))
+===== 8. Risiken und gesellschaftliche Fragen =====
-  * SynthID (Google DeepMind) bettet unsichtbare Wasserzeichen in KI-generierte Bilder und Videos ein. Diese sind für Menschen nicht erkennbar, können aber von Programmen zuverlässig gefunden werden.((Google DeepMind: SynthID. https://deepmind.google/models/synthid/))
-==== Regulierung: EU AI Act ====
+==== Deepfakes und Desinformation ====
+Mit generativer KI lassen sich sehr realistische Bilder und Videos von Personen erzeugen, sogenannte Deepfakes.
+Diese können gezielt eingesetzt werden, um falsche Informationen zu verbreiten oder Menschen Dinge in den Mund zu legen, die sie nie gesagt haben.
+Das Problem ist, dass solche Inhalte für viele Menschen kaum von echten Aufnahmen zu unterscheiden sind.
+Dadurch wird es schwieriger, zwischen Wahrheit und Manipulation zu unterscheiden.((BSI: Deepfakes Gefahren und Gegenmassnahmen. https://www.bsi.bund.de))
+==== Verlust von Vertrauen ====
+Wenn immer mehr Inhalte künstlich erzeugt werden, kann das langfristig das Vertrauen in Medien schwächen.
+Fotos und Videos galten früher oft als Beweis. Heute ist das nicht mehr selbstverständlich.
+Das betrifft zum Beispiel Journalismus, soziale Medien und auch politische Kommunikation.
-In der EU schreibt der AI Act vor, dass KI-generierte Inhalte als solche gekennzeichnet werden müssen – besonders Deepfakes. Soziale Plattformen wie YouTube und Meta setzen das bereits mit „Made with AI"-Labels um.((HubSpot: Generative KI und Urheberrecht. https://blog.hubspot.de/marketing/urheberrecht-ki))
 ==== Urheberrecht und Autorschaft ====
-Wem gehört ein KI-generiertes Bild? Das deutsche Recht gibt eine klare Antwort: Nach §2 des Urheberrechtsgesetzes (UrhG) können nur Menschen Urheber sein. Rein KI-generierte Werke sind deshalb nicht urheberrechtlich geschützt – sie gehören niemandem und gelten als gemeinfrei.((Bundesministerium der Justiz: Künstliche Intelligenz und Urheberrecht (FAQ). https://www.bmjv.de/SharedDocs/Downloads/DE/Themen/Nav_Themen/240305_FAQ_KI_Urheberrecht.pdf))
+Ein zentrales Problem ist die Frage, wem ein KI erzeugtes Bild gehört.
+In vielen Fällen gilt: Wenn kein Mensch kreativ beteiligt ist, gibt es kein klassisches Urheberrecht.
+Schwierig wird es, wenn ein Mensch aktiv am Ergebnis mitarbeitet, zum Beispiel durch gezielte Prompts oder Nachbearbeitung.
+Hier ist die Rechtslage noch nicht eindeutig geklärt.
-Schwieriger wird es, wenn ein Mensch viel kreative Arbeit in den Prompt gesteckt und das Ergebnis nachbearbeitet hat. Dann könnte ein Urheberrecht entstehen. Die genaue Grenze ist rechtlich noch nicht abschliessend geklärt.((Verbraucherportal BW: Das Urheberrecht und die Fallen bei Nutzung von generativer KI. https://www.verbraucherportal-bw.de/,Lde/Startseite/Verbraucherschutz/Das+Urheberrecht+und+die+Fallen+bei+Nutzung+von+generativer+KI))
 ==== Bias und Repräsentation ====
-KI-Modelle lernen aus Internetdaten – und das Internet spiegelt die Sichtweise bestimmter Gruppen stärker wider als andere. Das führt zu sogenanntem Bias: bestimmte Personengruppen, Körpertypen oder Kulturen werden stereotyp oder gar nicht dargestellt. Das ist kein technisches Versehen, sondern ein Spiegel der Trainingsdaten.((Ultralytics: Diffusionsmodelle – Generative AI erklärt. https://www.ultralytics.com/de/blog/what-are-diffusion-models-a-quick-and-comprehensive-guide))
+KI Modelle lernen aus grossen Datenmengen aus dem Internet. Diese Daten enthalten oft unbewusste Verzerrungen.
+Das kann dazu führen, dass bestimmte Gruppen stereotyp dargestellt werden oder weniger sichtbar sind.
+Solche Verzerrungen nennt man Bias und sie spiegeln gesellschaftliche Ungleichheiten wider.
+==== Missbrauch und Manipulation ====
+Neben Deepfakes gibt es weitere Risiken:
+  * Erstellung von Fake Bildern für Betrug
+  * Manipulation von Beweismaterial
+  * Automatisierte Propaganda
+Dadurch entsteht ein neues Feld von digitalen Sicherheitsproblemen.
 ==== Umwelt und Ressourcen ====
-Das Training grosser KI-Modelle braucht enorme Mengen an Rechenleistung und damit Strom. Ansätze wie Latent Diffusion reduzieren diesen Aufwand – aber das grundlegende Problem bleibt bestehen.((GuideGlare: Wie Diffusionsmodelle in der KI-Bilderzeugung funktionieren. https://www.guideglare.com/de/plattform/bild-suite/technologie/diffusionsmodelle-ki-bildgeneratoren))
+Das Training grosser Modelle benötigt viel Rechenleistung und Energie.
+Das führt zu einem hohen Stromverbrauch und damit zu Umweltbelastung.
+Neue Methoden versuchen, diese Kosten zu reduzieren, aber das Problem bleibt bestehen.
+===== 9. Spannende (Erklär)videos zum Thema generative KI ====
+<WRAP download>
+"AI, Machine Learning, Deep Learning and Generative AI Explained"((https://www.youtube.com/watch?v=qYNweeDHiyU))
+"Generative AI in a Nutshell - how to survive and thrive in the age of AI"((https://www.youtube.com/watch?v=2IK3DFHRFfw))
+"Evolution of AI"((https://www.youtube.com/shorts/HVn1v9Bsibw))
+</WRAP>
-===== 9. Zusammenfassung =====
+===== 10. Zusammenfassung =====
 <WRAP round tip>