Was klingt, wie eine Idee aus einem Science-Fiction-Roman ist heute bereits Realität: Man nimmt ein kurzes Video in seiner Muttersprache auf und kann innerhalb von wenigen Sekunden unzählige Fremdsprachen der Welt sprechen. Die Künstliche Intelligenz von ElevenLabs macht’s möglich und jede*r kann es selbst ausprobieren!

Worum geht’s genau?

In einem Video demonstriere ich, wie ich mithilfe einer kostenlosen KI innerhalb weniger Sekunden sieben schwierige Fremdsprachen sprechen kann. Hier das Video:

Quelle: Youtube

Das Programm erkennt aufgrund einer kurzen Sprachdatei die einzigartigen Stimmmerkmale und auch Akzente eines Sprechers. Danach wird eine perfekte Kopie der eigenen Stimme erstellt, die dann aber plötzlich den Text der Ursprungsdatei in einer anderen Sprache spricht. Dabei wird das Sprachtempo, Tonlage und die Betonung übernommen und sogar die Lippenbewegungen entsprechend der neuen Sprache angepasst! Das bedeutet also, dass mit ein und derselben Stimme Inhalte in 30 verschiedenen Sprachen zum Leben erweckt werden können.

Möglich macht das Ganze die Website Elevenlabs.io. ElevenLabs ist eine Plattform, die fortschrittliche KI-Modelle verwendet, um realistische Sprachausgabe in jeder Sprache, Stimme und Stil zu generieren. Mit ElevenLabs kannst du deine eigene Stimme klonen oder synthetische Stimmen in Minuten erstellen und Text in jeder Sprache sofort in Sprache umwandeln. Die Plattform bietet auch eine API für Text-to-Speech und AI Voice, mit der man AI-Stimmen in mehreren Sprachen schnell generieren kann.

Mit dem Update Eleven Multilingual v2 kann das neue Modell bei der Eingabe von Text in die Text-to-Speech-Plattform von ElevenLabs nun 30 Schriftsprachen automatisch erkennen und Sprache in diesen Sprachen mit einem bisher unerreichten Grad an Authentizität erzeugen.

Ein eigenes Video in 30 Sprachen übersetzen

Möchte man ein eigenes Video in 30 verschiedene Sprachen „übersetzen“, dann besucht man einfach die Webseite und erstellt sich ein kostenloses Benutzerkonto. Die Plattform bietet ein sogenanntes Freemium-Modell an, das heißt, dass man bestimmte Angebote kostenlos, aber begrenzt nutzen kann (ähnlich der früheren Demo-Versionen bei Programmen).

Danach kann man sofort loslegen. Das Interface der Website ist sehr einfach und übersichtlich gehalten. Im Menü klickt man einfach auf den Punkt „Dubbing“.

elevenlabs
Quelle: ElevenLabs.io

Danach klickt man auf die Schaltfläche „create new dub“. Hier kann man jetzt eine eigenes, kurzes Video (ca. 1 Minute lang) hochladen. Das Video dafür nimmt man einfach mithilfe der vorderen Kamera am Smartphone oder Tablet von sich selbst auf. Dabei sollte man langsam und deutlich sprechen. Sobald das Video hochgeladen ist, kann man einstellen, in welche Sprache das Videofile übersetzt werden soll. Man hat die Auswahl aus 30 Sprachen.

elevenlabs
Quelle: ElevenLabs.io

Zu den unterstützten Sprachen gehören: Koreanisch, Niederländisch, Türkisch, Schwedisch, Indonesisch, Vietnamesisch, Filipino, Ukrainisch, Griechisch, Tschechisch, Finnisch, Rumänisch, Dänisch, Bulgarisch, Malaiisch, Ungarisch, Norwegisch, Slowakisch, Kroatisch, Hocharabisch und Tamilisch. Diese Sprachen ergänzen die bereits verfügbaren Sprachen Englisch, Polnisch, Deutsch, Spanisch, Französisch, Italienisch, Hindi und Portugiesisch.

Durch einen Klick auf „Create“ wird innerhalb von wenigen Sekunden eine Videodatei erstellt, die man dann auch einfach downloaden und z.B. mit iMovie weiter verarbeiten kann.

weitere Funktionen von ElevenLabs

Neben dem Videodubbing bietet die Plattform auch noch die Funktion Stimmenklonung. Hierbei wird die Stimme einer Person künstlich nachgebildet. Mit ElevenLabs kann man eine Aufnahme der eigenen Stimme hochladen und eine künstliche Stimme erstellen, die der eigene sehr ähnlich klingt.

Außerdem gibt es einige vorgefertigte KI-Stimmen, die man für eigene Projekte verwenden kann. Dazu muss man einfach nur einen eigenen Text eingeben und die KI vertont ihn dann perfekt. Die Text-to-Speech-Funktionen (TTS) zählen zu den besten auf dem Markt. Die generierten Stimmen können natürlich auch noch angepasst werden, um die bestmögliche Qualität zu erzielen.

ElevenLabs bietet auch einen API-Zugang. Man kann also die Funktionen der Plattform in eigene Anwendungen integrieren. Die Sprachdesign-Funktion bietet außerdem noch die Möglichkeit, völlig neue Stimmen erstellen, indem du Geschlecht, Alter und Akzent der gewünschten Stimme auswählst.

Anwendungsmöglichkeiten im Unterricht

Die Anwendung eignet sich hervorragend dafür, den Schüler*innen die Möglichkeiten von KI eindrucksvoll zu demonstrieren. Die Schüler*innen können das Programm und seine Funktionen auch selbstständig ausprobieren. Besonders eindruckvoll ist, wie in meinem Beispielvideo, die Aufnahme eines einminütigen Videos und die automatische Übersetzung des Gesprochenen in verschiedene Sprachen.

Das alles kann innerhalb von ein bis zwei Unterrichtsstunden oder im Rahmen eines Projektes gut durchgeführt werden. Im Anschluss können die Videoaufnahmen dann auch noch mittels iMovie (am iPad) in einen Film verpackt und auf Youtube veröffentlicht werden.

Gefahren dieser Technologie

Natürlich eignet sich die Anwendung auch dazu, sich mit den ethischen Fragen von KI-Einsatz zu beschäftigen. Denn so aufregend diese neue Technologie auch sien mag, kann sie auch schnell gefährlich werden, wenn sie in die falschen (kriminellen) Hände gerät. So könnte diese Technologie z.B. Telefon-Scam (Stichwort: Enkel-Trick) auf ein ganz neues, kriminelles Level heben. Die perfekt geklonte Stimme eines tatsächlichen Angehörigen könnte noch überzeugender Geld fordern, als jemals zuvor.

Außerdem muss man sich die Frage stellen, ob in Zukunft nicht bald auch professionelle Synchronsprecher*innen überflüssig werden könnten, wenn die Stimmen der Schauspieler*innen einfach mithilfe einer KI geclont und in alle möglichen Sprachen lippensynchron übersetzt werden kann.

Fazit

Mit ElevenLabs kann man selbst ausprobieren, was heute bereits mit künstlicher Intelligenz möglich ist. Die Möglichkeit, ein eigenes Video kostenlos in 30 verschiedene Sprachen „übersetzen“ zu lassen, ist sensationell. Doch so faszinierend diese neue Technologie auch sein mag, muss man sich auch immer der Gefahren bewusst sein, die so eine mächtige KI mit sich bringen kann.