LTX Studio

LTX Studio Deep Dive – Die erste KI-basierte vollständige Bearbeitungssuite?

Stefan
8 Min Read
LTX Studio

LTX Studio ist eine von mehreren interessanten Generative AI-Videoanwendungen. Es stellt ein relativ einzigartiges Konzept dar, das Kontinuität und selektive Anpassungen betont. Darüber hinaus erstellt LTX Studio kein generiertes Filmmaterial. Es ist eine vollständige Bearbeitungssuite, einschließlich Zeitleiste, Ton, Kamerabewegung, Licht und Effekten. Obwohl ihr aktuelles Endprodukt nicht mit gefilmtem Filmmaterial mithalten kann, kann es ein hervorragendes Werkzeug für Pitching, Schreiben, Skripting, Storyboarding usw. sein. In diesem Artikel werden wir einige der anfänglichen halbunabhängigen Bemühungen bei der Entwicklung der Software überprüfen.

Bevor wir loslegen – alle Videos hier basieren auf einer vorläufigen Version von LTX Studio. Das bedeutet, dass sich bis zur Markteinführung noch vieles ändern kann, und es bedeutet auch, dass die Ersteller der Videos eine gewisse Beziehung zum Unternehmen (Lightricks) haben. In diesem Sinne gewährt Lightricks aufschlussreiche Einblicke in den tatsächlichen Arbeitsablauf, wie es die meisten anderen KI-Unternehmen nicht tun. Diese Videos bieten einen faszinierenden Einblick in die Zukunft der Inhaltserstellung und des Filmemachens – zumindest in einen wachsenden Teil davon.

Das Erste, was mir auffiel, war Sebastian Kamphs Entscheidung , den vorgegebenen Handlungssträngen zu folgen, anstatt mit einer eigenen Aufforderung zu beginnen. Ich könnte es auf den Drang zurückführen: „Lass mich einfach mit diesem neuen Spielzeug spielen!“, aber es scheint, als hätten sich auch andere Entwickler für diese Vorgehensweise entschieden, beispielsweise Tim Simmons von Theoretically Media, an den Sie sich vielleicht von der Einführungsveranstaltung des Unternehmens erinnern . Da sich die App noch in der Anfangsphase befindet, scheint dies nicht allzu problematisch zu sein, aber wenn sie weiterhin auf voreingestellte Aufforderungen beschränkt ist, sollte das meiner Meinung nach offengelegt werden. Das Unternehmen hat möglicherweise den verantwortungsvolleren Weg gewählt und die Anzahl der frühen Tester begrenzt, um das Ergebnis einzugrenzen. Generative KI-Systeme können sich als unvorhersehbar erweisen, also ist Vorsicht geboten.

Ins Storyboard

Die Dinge scheinen sich deutlich zu verbessern, wenn man sich in den Workflow vertieft. Nach einer relativ kurzen Ladezeit (obwohl hier möglicherweise Bearbeitung erforderlich ist) stellt das System einen Titel und eine Reihe von Zeichen basierend auf der zuvor eingegebenen Eingabeaufforderung oder „Synopsis“ bereit. Der Benutzer kann aus mehreren verschiedenen Seitenverhältnissen und Filmstilen wählen (obwohl ich bisher nur Beispiele des standardmäßigen „Filmstils“ gesehen habe, mit Hinweisen auf andere Stile wie den hier in der Vorschau gezeigten) . Alle Filmstile können in späteren Phasen des Projekts geändert werden oder wenn Sie mehrere unterschiedliche Looks ausprobieren möchten. Meiner Meinung nach ist es eines der nützlicheren Tools von LTX Studio, aber dazu später mehr.

Konsistente dynamische Charaktere

Eine der einzigartigen Funktionen von LTX Studio ist die Fähigkeit, konsistente Charaktere über die gesamte Handlung (und das Endprodukt) hinweg zu generieren. Jeder Charakter ist einzeln editierbar. Jede Bearbeitung kann „aufgefrischt“ werden, um eine andere KI-Version derselben Eingabeaufforderung zu generieren. Die Eingabeaufforderung kann auch vor und während des Bearbeitungsvorgangs geändert werden. Die frühe Version ermöglicht auch das Einfügen vorhandener Bilder zum Austausch von Gesichtern, aber ich muss sagen – diese Funktion scheint ziemlich problematisch zu sein. Sie ermöglicht einfache Deep Fakes und kann eine Vielzahl rechtlicher Probleme mit sich bringen. Obwohl sie möglicherweise nützlich ist, bin ich mir nicht sicher, ob wir sie in der endgültigen Version sehen werden.

Jetzt drücken wir auf „Start“ und sehen, wie die Magie entsteht

Die Inhaltsangabe und die Besetzung stehen fest, und nun kann LTX Studio die Struktur der Geschichte erstellen. Hier sehen wir den besten Beweis für die einzigartige konzeptionelle Wahrnehmung hinter LTX Studio. Es geht nicht darum, das bestaussehende Filmmaterial zu erstellen, sondern um die Infrastruktur der Geschichte. Die Software/App erweitert die Inhaltsangabe und unterteilt sie in Szenen, wobei jede Szene in bestimmte Aufnahmen unterteilt ist.

Hier können Sie verschiedene Aspekte jeder Aufnahme steuern. Weitwinkel, Nahaufnahme, Halbtotale, niedrige oder hohe Winkel, Bewegungsskala und die Eingabeaufforderung selbst sind alle veränderbar. Sie können auch per Drag & Drop zwischen den Aufnahmen wechseln. Das linke Bedienfeld beeinflusst die gesamte Szene und entscheidet über Ort, Beleuchtung und Wetterbedingungen (obwohl manchmal zusätzliche Einstellungen erforderlich sind). Es gibt auch eine Registerkarte für Ton, die Voiceover und Umgebungsgeräusche in zwei verschiedenen Kanälen ermöglicht, die jeweils separat gesteuert werden.

Aufnahmeeditor

Der Shot-Editor ermöglicht eine weitere Kontrolle über jeden Shot in einem separaten Fenster. Hier können Sie eine bestimmte Kamerabewegungsvorgabe festlegen, deren Intensität anpassen und eine negative Eingabeaufforderung hinzufügen, um besser zu kontrollieren, was nicht im Bild sein sollte. Eine Bildaufforderung, bei der Sie ein Referenzbild hochladen, sollte in Zukunft verfügbar sein.

Dauer und Bildrate werden ebenfalls hier eingestellt. Die benutzerdefinierte Kamerabewegung ist ziemlich beeindruckend und ermöglicht es Ihnen, einen relativ präzisen Bewegungspfad in einer aus der Aufnahme generierten halb-dreidimensionalen Umgebung zu definieren.

Zusatzfunktionen

LTX Studio ist eine App mit zahlreichen Funktionen. Meiner Meinung nach ist sie eher mit vollwertiger Bearbeitungssoftware wie Adobe Premiere, DaVinci Resolve oder Final Cut Pro verwandt als mit anderen KI-Generatoren . Zusätzlich zu den oben besprochenen Funktionen sind noch viele weitere verfügbar – Gesichtstausch, Inpainting (um bestimmte Details auszumalen) usw. Es sind auch verschiedene Videostile verfügbar (Aquarell, 3D-Modell, Anime usw.), und das Unternehmen legt mehr Wert auf selektive Anpassungen und Kontinuität als auf andere Funktionen.

Aktuelle Anwendungsfälle

Derzeit tut sich LTX Studio schwer, Filmmaterial zu liefern, das fälschlicherweise als von der Kamera stammend wahrgenommen werden könnte. Auch wenn wir unseren nächsten Spielfilm vielleicht nicht so bald damit drehen, kann es dennoch als Skript-, Pitching- oder Storyboarding-Tool nützlich sein. Seine beeindruckendste Leistung ist der Proof of Concept eines KI-basierten Videobearbeitungstools. Hier liegt der Kernunterschied zwischen LTX Studio und seiner Muttergesellschaft Lightricks sowie anderen Akteuren in diesem Bereich. Lightricks ist ein Technologieunternehmen, aber ein Großteil seiner Mitarbeiter kommt aus der kreativen Welt – Designer, Fotografen, Filmemacher usw. Daher legen seine Produkte eher den Schwerpunkt auf kreative Arbeitsabläufe als auf algorithmische Meisterleistungen.

Endresultat

Wenn wir LTX Studio an diesem Punkt anhand der filmischen Qualität des Endergebnisses beurteilen sollen, ist es noch weit davon entfernt, aktuelle Kamera- oder CGI-basierte Bilder herauszufordern. Da es von Lightricks kommt , ist es keine Überraschung, dass es größtenteils wie ein Standbild aussieht, dem nachträglich etwas Bewegung hinzugefügt wurde. Alle „Signature Moves“ früherer KI-Bildgeneratoren sind auch hier vorhanden, mit seltsamen Fingern, unbeholfenen Körperhaltungen und unechten Dialogen. Aber so düster es auch klingen mag, ich glaube, das einflussreichste Produkt, das LTX Studio bietet, ist das UX-Design. Meines Wissens nach ist dies der erste Versuch, eine vollwertige Bearbeitungssoftware rund um generative KI zu erstellen. Es demonstriert einige der unglaublichen Potenziale, die unsere Branche in den kommenden Jahren wahrscheinlich prägen werden.