Diese KI erstellt aus Ihren Worten ein Video
Webagentur » Digitale Nachrichten » Diese KI erstellt aus Ihren Worten ein Video

Diese KI erstellt aus Ihren Worten ein Video

Es sollte für jeden, der die Nachrichten über generative KI verfolgt, offensichtlich sein, dass die neue Technologie schnell allgegenwärtig wird. Letztes Jahr eroberten KI-Bildgeneratoren die Welt im Sturm, und gegen Ende des Jahres 2022 eroberte ChatGPT die öffentliche Vorstellungskraft. Jetzt, ein paar Wochen im Jahr 2023, ist die Text-zu-Video-KI fast da.

Diese Woche kündigte das KI-Startup Runway Gen-2 an, ein multimodales KI-System, das Videos mit Clips anderer Videos, Bildern oder sogar nur Text generieren kann. Das ist richtig, schon bald werden die Benutzer in der Lage sein, alles, was sie wollen, in eine Eingabeaufforderung einzugeben und ein vollständig produziertes Video von dem zu erhalten, was sie sich in ihrer Vorstellung vorgestellt haben.

Wie bei allen neuen Technologien ist sie jedoch noch nicht ganz bereit für die Hauptsendezeit. Nach Gizmodos Kyle Bar, während die neue Video-KI von Runway noch nicht öffentlich zugänglich ist, gibt es bereits einen anderen Videosynthesedienst: ModelScope, der erst vor wenigen Tagen veröffentlicht wurde. Die Website ist hauptsächlich auf Chinesisch, mit einigen Abschnitten auf Englisch. Aber die von der KI generierten Beispielvideos auf der Website sind ziemlich beeindruckend, wenn auch grob.

Einige der Beispiele auf der ModelScope-Site sind „eine Giraffe unter einer Mikrowelle“, „ein Goldendoodle, das in einem Park am Seeufer spielt“, „ein Panda, der ein Auto fährt“, „ein Teddybär, der in New York läuft“ usw. . Jeder Videoclip ist nur wenige Sekunden lang, demonstriert aber deutlich die Leistungsfähigkeit der neuen Technologie. Es ist erwähnenswert, dass jedes Beispielvideo ein Shutterstock-Wasserzeichen enthält, wahrscheinlich weil das Unternehmen Stock Footage verwendet hat, um seine KI zu trainieren.

Allerdings ist ModelScope nicht gerade benutzerfreundlich. Abgesehen davon, dass die Website hauptsächlich auf Chinesisch ist, müssen die Benutzer anscheinend ein wenig recherchieren (oder die Vor- und Nachteile der generativen KI kennen), damit sie funktioniert. Es ist noch nicht wie ChatGPT oder New Bing. Aber die bloße Existenz dieser Technologie im Internet bedeutet, dass Text zu Video viel früher kommt, als viele von uns dachten.

Quelle: Gizmodo

★ ★ ★ ★ ★