Get 20M+ Full-Text Papers For Less Than $1.50/day. Start a 14-Day Trial for You or Your Team.

Learn More →

Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung

Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung ABI Technik 2015; 35(1): 23–35 Fachbeitrag Maria Wernersson Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung Zusammenfassung: Im Jahr 2014 wurde eine Schätzung side character accuracy, reading order and format recog- der OCR-Genauigkeit von 11 354 digitalisierten Seiten aus nition were tested. der Allgemeinen Zeitung durchgeführt. Die getesteten There are multiple aspects to take into account when es- Zeitungsbände stammen aus dem Zeitraum 1871–1921. timating OCR accuracy, especially in regard to comparing Um die Genauigkeit zu schätzen, wurden Regeln für die different evaluations in which factors like error classifica- Bewertung der Fehler aufgestellt, Textstichproben auto- tion or the purpose of the respective digitization might matisch per Skript erstellt und die Stichproben manuell vary. ausgewertet. Mit einer geschätzten Zeichengenauigkeit zwischen DOI 10.1515/abitech-2015-0014 94,70 Prozent und 97,65 Prozent (Konfidenzzahl: 95 Pro- zent) wurde ein gutes, zufriedenstellendes Resultat er- 1 Einführung – reicht. Außer der Zeichengenauigkeit wurde auch die Er- kennung des Leseflusses und des Formats geprüft. Evaluationsgrundlage Bei der Evaluierung von OCR-Genauigkeit gilt es viele und Zielsetzung Faktoren zu beachten. Dies trifft vor allem auf den späte- ren Vergleich verschiedener Evaluierungen zu, weil Fak- toren wie Fehlerklassifikation und Zweck der Digitalisie- Im Kontext des DFG-Rahmenantrags „Digitalisierung His- rung variieren http://www.deepdyve.com/assets/images/DeepDyve-Logo-lg.png ABI Technik de Gruyter

Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung

ABI Technik , Volume 35 (1) – Apr 1, 2015

Loading next page...
 
/lp/de-gruyter/evaluation-von-automatisch-erzeugten-ocr-daten-am-beispiel-der-4CdzFENAJR
Publisher
de Gruyter
Copyright
Copyright © 2011–2019 by Walter de Gruyter GmbH
ISSN
2191-4664
DOI
10.1515/abitech-2015-0014
Publisher site
See Article on Publisher Site

Abstract

ABI Technik 2015; 35(1): 23–35 Fachbeitrag Maria Wernersson Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung Zusammenfassung: Im Jahr 2014 wurde eine Schätzung side character accuracy, reading order and format recog- der OCR-Genauigkeit von 11 354 digitalisierten Seiten aus nition were tested. der Allgemeinen Zeitung durchgeführt. Die getesteten There are multiple aspects to take into account when es- Zeitungsbände stammen aus dem Zeitraum 1871–1921. timating OCR accuracy, especially in regard to comparing Um die Genauigkeit zu schätzen, wurden Regeln für die different evaluations in which factors like error classifica- Bewertung der Fehler aufgestellt, Textstichproben auto- tion or the purpose of the respective digitization might matisch per Skript erstellt und die Stichproben manuell vary. ausgewertet. Mit einer geschätzten Zeichengenauigkeit zwischen DOI 10.1515/abitech-2015-0014 94,70 Prozent und 97,65 Prozent (Konfidenzzahl: 95 Pro- zent) wurde ein gutes, zufriedenstellendes Resultat er- 1 Einführung – reicht. Außer der Zeichengenauigkeit wurde auch die Er- kennung des Leseflusses und des Formats geprüft. Evaluationsgrundlage Bei der Evaluierung von OCR-Genauigkeit gilt es viele und Zielsetzung Faktoren zu beachten. Dies trifft vor allem auf den späte- ren Vergleich verschiedener Evaluierungen zu, weil Fak- toren wie Fehlerklassifikation und Zweck der Digitalisie- Im Kontext des DFG-Rahmenantrags „Digitalisierung His- rung variieren

Journal

ABI Technikde Gruyter

Published: Apr 1, 2015

There are no references for this article.