ElevenLabs

ElevenLabs

Mit Hilfe der Webanwendung ElevenLabs (opens in a new tab) können mit wenigen Klicks realistisch klingende Sprachausgaben aus geschriebenem Text erzeugt werden. Um den Dienst zu nutzen, braucht es eine Registrierung. Die erweiterten Funktionen sind für $ 5.- pro Monat als Abo verfügbar. Diese ermöglichen es, eigene Audiodateien hochzuladen, um das System auf eine reale Stimme zu trainieren.

Beispiel

Mit Hilfe dieser Aufnahme soll das Modell trainiert werden:

Nachdem ein kostenpflichtiges Abo erstellt wurde, kann im Voicelab eine neue Stimme geklont werden. Die Funktion nennt sich Instant Voice Cloning. Im angezeigten Fenster können anschliessend bis zu 25 Beispiele der Zielstimme hochgeladen werden. Das Resultat ist jedoch bereits bei einem Sample beeindruckend.

ElevenLabs VoiceLab

ElevenLabs VoiceLab

Wenn die Stimme geklont wurde, kann sie innert wenigen Sekunden benutzt werden. Der Modus nennt sich Speech Synthesis. Hier kann das aktuelle Modell Eleven Multilingual v2 sowie die gewünschte Stimme ausgewählt werden. Es empfiehlt sich, eine kurze Textpassage zu wählen und mit den Voice Settings etwas zu spielen.

ElevenLabs VoiceLab

ElevenLabs VoiceLab

Anschliessend kann der eingegebene Text durch Generate in eine Audiodatei umgewandelt werden und bei Bedarf im MP3-Format heruntergeladen werden. Hier das Resultat: