Episode 9: AI-Tools zur Digitalisierung von handgeschriebenem Text
Podcast
Podcaster
Beschreibung
vor 1 Jahr
Adam präsentiert in der neunten Episode des AIne Ahnung Podcasts
verschiedene AI-Tools zur handschriftlichen OCR (optischen
Zeichenerkennung). Nachdem er zuvor mit Sprach-zu-Text- und
Text-zu-Sprach-Syntheseexperimenten beeindruckt war, widmet er sich
nun dem Erfassen und Digitalisieren von handschriftlichen Texten.
Er stellt drei Tools vor: die Vision API von Google, Tesseract OCR
und Transcribus. Adam hat ein 30-seitiges Manuskript geschrieben
und möchte es digitalisieren. Er fotografiert die Seiten und lässt
sie durch die OCR-Tools laufen. Quantitativ werden die Texte gut
erfasst, mit einzelnen Wörtern und Absätzen. Allerdings ist er mit
den Ergebnissen noch nicht zufriedenstellend. Etwa jedes dritte
oder vierte Wort wird falsch erkannt oder den arabischen Buchstaben
zugeordnet. Adam glaubt jedoch, dass OCR bessere Ergebnisse liefern
kann und plant, weiterzuforschen. Er wird versuchen, sauberere und
besser lesbare Seiten zu verwenden. Adam lädt die Zuhörer ein, ihm
ihre Erfahrungen oder Tipps zur handschriftlichen Texterkennung
mitzuteilen. Er erwähnt bereits den Rat eines Google-Mitarbeiters
und freut sich über weitere Rückmeldungen. Mit diesem Ausblick
verabschiedet er sich und verspricht, dran zu bleiben. Kilometer
8.434. Ciao!
verschiedene AI-Tools zur handschriftlichen OCR (optischen
Zeichenerkennung). Nachdem er zuvor mit Sprach-zu-Text- und
Text-zu-Sprach-Syntheseexperimenten beeindruckt war, widmet er sich
nun dem Erfassen und Digitalisieren von handschriftlichen Texten.
Er stellt drei Tools vor: die Vision API von Google, Tesseract OCR
und Transcribus. Adam hat ein 30-seitiges Manuskript geschrieben
und möchte es digitalisieren. Er fotografiert die Seiten und lässt
sie durch die OCR-Tools laufen. Quantitativ werden die Texte gut
erfasst, mit einzelnen Wörtern und Absätzen. Allerdings ist er mit
den Ergebnissen noch nicht zufriedenstellend. Etwa jedes dritte
oder vierte Wort wird falsch erkannt oder den arabischen Buchstaben
zugeordnet. Adam glaubt jedoch, dass OCR bessere Ergebnisse liefern
kann und plant, weiterzuforschen. Er wird versuchen, sauberere und
besser lesbare Seiten zu verwenden. Adam lädt die Zuhörer ein, ihm
ihre Erfahrungen oder Tipps zur handschriftlichen Texterkennung
mitzuteilen. Er erwähnt bereits den Rat eines Google-Mitarbeiters
und freut sich über weitere Rückmeldungen. Mit diesem Ausblick
verabschiedet er sich und verspricht, dran zu bleiben. Kilometer
8.434. Ciao!
Weitere Episoden
In Podcasts werben
Kommentare (0)