Texterkennung für Audiodateien wie MP3 und WAV-Dateien mit Youtube. Youtube erstellt für Videos automatisch Untertitel, eine Funktion, welche wir nutzen wollen, um Audio nach Text umzuwandeln.
In unserem Beispiel gehen wir davon aus, dass unsere Audiodatei eine MP3-Datei ist.
Video erstellen
Sofern unser Ausgangsmaterial nur als Audiodatei verfügbar ist, müssen wir erstmal ein Video erstellen. Dies geht recht leicht mit einer Videobearbeitungssoftware. Im Beispiel verwende ich meine Software Filmora9, andere Software funktioniert auch, z.B. Shotcut.
Hier importieren wir die Audiodatei und exportieren diese anschließend als MP4-Video. Ein Video ohne Bild und ohne Ton.
Upload bei Youtube
Nun laden wir das neue Video bei Youtube hoch.
Das Video sollten wir auf “Nicht gelistet” stellen, damit ist es nur mit dem Link aus dem Internet erreichbar.
Youtube benötigt etwas Zeit für die Erstellung der Untertitel, daher müssen wir warten, bis das Icon für die Untertitel auftaucht.
Download der Untertitel
Für den Download der Untertitel gibt es ein Online-Tool.
Hier müssen wir nur den Link zum Video einfügen und den Download-Button bestätigen. Manchmal kommt ein Fehler, dann sollte man einfach den Download-Button nochmal klicken.
Nach einer kurzen Wartezeit erfolgt der Download der Untertitel.
Die Datei können wir mit einem beliebigen Texteditor öffnen:
Youtube selbst achtet nicht auf Groß-/Kleinschreibung. Hier hilft etwas manuelle Rechtschreibkorrektur in Word weiter.
Das Video ist zwar nicht öffentlich sichtbar, aber es kann nicht schaden, das Video wieder zu entfernen. Dies geht in den Kanalvideos, hier kann das Video wieder entfernt werden.
Fazit und Alternativen
Prinzipiell funktioniert der Ansatz, erfordert aber manuelles Nacharbeiten. Als Alternative gibt es ein paar Online-Dienste, welche eine Transkription durchführen können. Diese sind jedoch meist kostenpflichtig:
Weitere Beispiele findet man über Google. Auch Spracherkennungssoftware verfügt meist über eine entsprechende Funktion.
- Perfekt für Studenten, schüler, Lehrer und vielbeschäftigte multitasker
- Dokumente mühelos Diktieren, bearbeiten und formatieren
- Dreimal schneller als tippen