Deepfakes sind künstliche Medien, die mithilfe von Deep-Learning-Techniken und einem Kofferwort aus „Deep Learning“ und „Fake“ erstellt werden. Deepfakes ersetzen Merkmale eines Bildes durch die eines anderen.
Die Idee, mit Hilfe von Bildbearbeitungssoftware Gesichter auszutauschen oder synthetische Medien zu erstellen, ist nicht neu. Was die Technik hinter Deepfakes aber so wichtig macht, ist die Tatsache, dass sie es praktisch jedem ermöglicht, dasselbe zu erstellen, ohne künstlerische Fähigkeiten erlernen zu müssen, und das in einem viel größeren Maßstab.
Wie funktioniert ein Deepfake?
Deepfake verwenden fortgeschrittene Deep-Learning- Techniken, um zunächst Merkmale zu kodieren und dann Bilder aus den kodierten Merkmalen zu rekonstruieren. Autoencoder, eine Art neuronales Netzwerk , sind die am häufigsten verwendete Deep-Learning-Architektur zum Erstellen von Deepfakes. Lassen Sie uns dies anhand eines Beispiels untersuchen, bei dem die Deepfake-Technik zum Vertauschen der Gesichter zweier Personen verwendet wird. Dies wird in der folgenden Abbildung im Detail dargestellt.
Der erste Schritt zur Erstellung eines Deepfakes besteht darin, die Gesichtsbilder mithilfe eines Encoders in kleinere, merkmalsbasierte Darstellungen umzuwandeln. Diese informationsreichere Darstellung wird oft als latentes Gesicht bezeichnet. Das latente Gesicht enthält Darstellungen für Merkmale wie Nasenform, Hautton und Augenfarbe. Wir verwenden für jede Person denselben Encoder, sodass die erstellten Darstellungen dieselbe Bedeutung haben.
Anschließend wandeln wir das latente Gesicht mithilfe eines Decoders wieder in ein Bild um. Je nachdem, welche Bilder wir zum Trainieren des Decoders verwenden, variiert das ausgegebene Gesichtsbild. Der entscheidende Teil beim Gesichtsaustausch besteht darin, dass der Decoder für Person A auf das latente Gesicht von Person B angewendet wird und umgekehrt. Auf diese Weise hat das ausgegebene Gesicht den Ausdruck und die Struktur von Person A, aber den Stil und das Aussehen von Person B.
Diese Abbildung zeigt den Deepfake-Prozess durch Training (obere zwei Reihen) und die Erstellung eines Deepfakes (untere Reihe). In der Trainingsphase wird der Encoder (blau) zwischen verschiedenen Bildern geteilt, um die latenten Gesichter (mittlere Porträts) aus den Eingabebildern (linke Porträts) zu erstellen.
Für jede Person (grün und rosa) werden individuelle Decoder trainiert. In der Erstellungsphase wird derselbe Encoder verwendet, aber der Decoder einer anderen Person. Dadurch entsteht ein Bild, das die Pose und den Ausdruck des Eingabebilds aufweist, aber den Stil der Person, die zum Erstellen des Decoders verwendet wurde.
Sind Deepfakes nur Videos?
Während Deepfakes am häufigsten in Videos präsentiert werden, können sie auch in Fotos und sogar Audiodateien vorkommen.
Zu den wichtigsten Anwendungen der Deepfake-Technologie gehören:
- Gesichtstausch: Gesichtstausch ist die häufigste und offensichtlichste Technik, bei der die Gesichter zweier Personen vertauscht werden. Dies dient im Allgemeinen dazu, ein Bild einer Berühmtheit in einer Szene zu erstellen, in der sie nicht mitwirkte.
- Gesichtssynthese: Die Gesichtssynthese erweitert die Realität und generiert ein Gesicht für eine Person, die nie existiert hat.
- Manipulation von Gesichtsattributen und -ausdruck: Bei der Manipulation von Attributen und Ausdruck wird ein Gesicht verändert, indem entweder bestimmte Merkmale wie die Augen geändert werden oder der Ausdruck verändert wird, zum Beispiel indem ein Stirnrunzeln in ein Stirnrunzeln verwandelt wird.
So erkennen Sie einen Deepfake
Angesichts der breiten Verfügbarkeit von Deepfake-Generierungstools ist es wichtig, dass jeder ein grundlegendes Verständnis davon hat, wie man einen Deepfake erkennt. Tatsächlich haben Unternehmen wie Google, Amazon und Meta die Community aktiv dazu ermutigt, zu analysieren und zu verstehen, was einen Deepfake verrät. Durch ihre und die Forschung anderer haben sie eine Vielzahl von Möglichkeiten entdeckt, einen Deepfake zu erkennen:
- Unnatürliches Gesicht, Umgebung oder Beleuchtung: Deepfake-Bilder oder Videoabschnitte können unnatürliche Gesichtsausdrücke, Gesichtszüge oder ungleichmäßige Kanten aufweisen. Auch die Umgebung selbst (wie die Beleuchtung) kann unrealistisch sein.
- Unnatürliches Verhalten: In Deepfake-Videos muss eine Kontinuität zwischen den Bildern bestehen, was jedoch schwierig umzusetzen ist. Daher können Sie unnatürliches Verhalten wie unregelmäßiges Blinzeln oder abgehackte Bewegungen feststellen.
- Bildartefakte und Unschärfe: Deepfake-Bilder können seltsame Artefakte aufweisen, wie etwa Unschärfe um den Hals, wo der Körper einer Person mit dem Gesicht einer anderen zusammengenäht ist.
- Audio: Wenn Deepfakes mit Audio kombiniert werden, können die Lippen eine unerwartete Bewegung ausführen, verglichen mit dem, was Sie vom Audio erwarten würden.
Wie erstellt man einen Deepfake?
Das Erstellen von Deepfakes ist überraschend einfach. Es gibt eine Vielzahl von Smartphone-Apps, die die Produktion von Deepfakes für einen Großteil der Bevölkerung leicht zugänglich machen. Zusätzlich zu Apps gibt es Computerprogramme, mit denen eine Person weitaus fortgeschrittenere Reproduktionen auf lokalen CPUs (Computer Processing Units) oder die besten Reproduktionen auf GPUs (Graphics Processing Units) ausführen kann.
Einige der beliebtesten Tools sind:
- FaceApp : FaceApp transformiert Fotos, um Funktionen hinzuzufügen und zu entfernen, sodass Benutzer mit nur wenigen Klicks prominente Fotos erstellen können.
- Wombo : Wombo erstellt Gesangs- und Tanzvideoclips aus den hochgeladenen Fotos der Benutzer.
- DeepFaceLab : Die PC-Software DeepFaceLab wird bei der Erstellung von 95 Prozent der Deepfake-Videos verwendet.
- Deepfakes Web : Deepfakes Web ist eine Cloud-basierte Anwendung, die die Gesichter von Personen in Videos realistisch austauschen kann.
Welche Risiken bergen Deepfakes?
Wie viele technologische Innovationen haben Deepfakes sowohl positive als auch negative Auswirkungen.
Untersuchungen haben ergeben, dass 98 Prozent der Deepfake-Videos für pornografische Zwecke erstellt werden. Die Entwickler produzieren Videos, in denen die Gesichter von Prominenten auf Models platziert werden. Diese Anwendung hat zu kritischen Reaktionen geführt. Viele Länder haben beschlossen, pornografische Deepfakes zu verbieten. Mehrere Websites haben erklärt, dass Deepfake-Pornografie gegen ihre Geschäftsbedingungen verstößt.
Im Jahr 2022 verbot Google die Nutzung seines Colab-Dienstes zur Erstellung von Deepfakes, eine zuvor beliebte Methode zum Trainieren von Deepfake-Modellen. Und ab 2024 verlangt YouTube von den Erstellern, den Zuschauern offenzulegen, wenn realistische Inhalte mit synthetischen Medien oder generativer KI erstellt werden , einschließlich Inhalten, die „das Abbild einer realen Person verwenden“. Meta wird ab 2024 auch damit beginnen, KI-generierte Bilder auf Facebook, Instagram und Threads anhand von branchenüblichen Indikatoren zu kennzeichnen. Diese Maßnahmen von Google und Meta zielen darauf ab, die Verbreitung dieser Art von Deepfakes weiter zu reduzieren.
Der Einsatz von Deepfakes im politischen Bereich ist wahrscheinlich der umstrittenste. Während der russischen Invasion in der Ukraine im Jahr 2022 kursierte auf Twitter ein Deepfake des russischen Präsidenten Wladimir Putin, der seine Kapitulation vor der Ukraine zeigte. Es gab auch viele Deepfakes von US-Präsident Donald Trump, darunter einen ganzen Film , der von den South Park-Machern Matt Stone und Trey Parker entwickelt wurde.
Die hohe Qualität von Deepfakes macht es der breiten Öffentlichkeit schwer, Fakten von Fiktion zu unterscheiden. Selbst wenn sich ein Deepfake später als Fälschung herausstellt, kann das Video bereits erheblichen Schaden angerichtet haben.
Häufig gestellte Fragen
Was ist ein Deepfake?
Ein Deepfake bezieht sich auf Medien, die digital verändert werden, um das Gesicht oder den Körper einer Person durch das einer anderen zu ersetzen. Deepfakes werden mithilfe von Deep-Learning-Technologie erstellt, daher ist der Begriff ein Kofferwort aus „Deep Learning“ und „Fake“.
Sind Deepfakes illegal?
Deepfakes können illegal sein, wenn sie zum Zweck der Bereitstellung nicht einvernehmlicher und expliziter Inhalte, der Verleumdung, der Fehlinformation oder der vorsätzlichen emotionalen Belastung erstellt werden.
Kann Deepfake erkannt werden?
Deepfakes können durch die Identifizierung unnatürlicher Gesichts-, Umgebungs- oder Verhaltensmerkmale erkannt werden, wie etwa Unschärfe, ungleichmäßiges Blinzeln und Körper- oder Lippenbewegungen, die nicht mit dem Video-Audio übereinstimmen.
Mithilfe von Deepfake-Erkennungssoftware können auch Deepfake-Medien erkannt werden.
Wie können Sie erkennen, ob ein Video mithilfe von KI erstellt wurde?
Ein KI-generiertes Video kann anhand der folgenden Merkmale identifiziert werden:
- Ungewöhnliche Unschärfe, Schatten oder Lichtflackern auf Elementen im gesamten Video
- Unnatürliche Körpersprache oder Körperkomposition
- Unrealistische, glänzende oder plastikartige Texturen und Oberflächen
- Übermäßig gesättigte oder kräftige Farben
- Ungleichmäßige oder abgehackte Bewegungen
- Objekte, Körper oder Körperteile, die plötzlich auftauchen, verschwinden oder ineinander übergehen