Gglot.com – Videos und Audio-Dateien in Text umwandeln

Texterkennung für Sprache, sogenannte Audio-Transkription wandelt Video- und Audio-Dateien automatisch in Text um.

Das gesprochene Wort, sei es in Video oder Audio hat den Nachteil, dass es schwer durchsuchbar ist. Nun könnte man Audio-Dateien oder Videos abtippen, das ist aber meist recht aufwändig. Aber für jedes Problem gibt es einen passenden Dienst im Internet. So bin ich vor Kurzem auf den Dienst Gglot.com gestoßen und habe diesen getestet.

Der Dienst konvertiert Audio- und Video-Dateien in Text. 60 Sprachen werden laut Anbieter unterstützt. Die Anmeldung ist kostenlos, gewählt werden kann anschließend zwischen verschiedenen Tarifen. Der Basistarif ist kostenlos, leider gibt es kein Startguthaben für ein paar Tests. Also habe ich 10 Dollar aufgeladen, was über Kreditkarte oder Paypal möglich ist. Es gibt auch kostenpflichtige Tarife mit monatlicher Gebühr, welche mehr Funktionen bereitstellen.

Transkribieren von Dateien

Zum Transkribieren wird wahlweise eine Video- oder Audio-Datei hochgeladen oder eine URL zu einem Youtube-Video eingegeben. Letzteres spart den Upload von großen Dateien. Anschließend legt man noch die Sprache fest und die Anzahl der Sprecher. Zur Verwirrung trägt bei, dass der Sprecher mit “Lautsprecher” übersetzt worden ist. Gut im englischen ist der Speaker der Sprecher, genauso wieder Lautsprecher.

Nach dem Upload wird der Preis angezeigt, was die Umwandlung kostet. Jede Minute kostet 0,09 Dollar. Mit einem Klick beginnt das System nun an zu Arbeiten. Etwas Geduld muss man mitbringen, sobald der Vorgang abgeschlossen ist, kommt eine Benachrichtigung per E-Mail.

Anschließend kann das Ergebnis heruntergeladen werden, wahlweise als Text, Word, Excel, Text-Datei oder auch im Youtube-Untertitel Format. Bei längeren Audiodateien erfolgt auch eine zeitliche Unterteilung. Bei mehreren Sprechern erfolgt zudem eine Unterteilung. Zusätzlich bietet der Dienst auch gleich eine Möglichkeit an, den Text zu übersetzen.

Die Qualität der Transkription hängt viel vom Eingangsmaterial ab. Wer den Text deutlich und mit Pausen einspricht, erhält bessere Ergebnisse als der Podcast, in welchem alle durcheinander reden. Wer den Text irgendwo veröffentlichen will und auf Fehlerfreiheit Wert legt, kommt um eine Überprüfung nicht umhin. Wer hingegen nur seinen Podcast für Google durchsuchbar machen möchte, braucht dies nicht unbedingt.

Insgesamt muss man auch sagen, dass es auch keine einfache Aufgabe ist, Sprache in Text zu übersetzen und dabei alles richtig zu erkennen, inklusive Punkt und Komma. Viele Spracherkennungssoftware funktioniert auch nur dann, wenn man Satzzeichen explizit ansagt.

Fazit

Audio- und Videodateien schnell mal in Text umwandeln funktioniert ganz gut mit Gglot.com, sofern das Eingangsmaterial passt. Der Dienst ist zwar nicht kostenlos, aber der Test kostet auch nicht viel Welt und mit 10 Dollar kommt man auch schon ein Stück weit und die Anmeldung selbst ist kostenlos möglich. Schön wäre noch ein kleines Startguthaben zum Test gewesen.

Kommentar hinterlassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.