Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

DTA-Nachrichten vom 28. August 2012

Artikel über Qualitätssicherung im DTA im Jahrbuch für Computerphilologie erschienen

Alexander Geyken, Susanne Haaf, Bryan Jurish, Matthias Schulz, Christian Thomas, Frank Wiegand: „TEI und Textkorpora: Fehlerklassifikation und Qualitätskontrolle vor, während und nach der Texterfassung im Deutschen Textarchiv“. In: Jahrbuch für Computerphilologie, Forum [online-Version vom 05.08.2012].

Der Beitrag widmet sich der „Frage nach typischen Fehlerquellen und -kategorien bei der Erfassung und Annotation historischer Texte unterschiedlicher Textsorten [...]. Dabei werden exemplarisch Verfahren der Fehlerermittlung, Möglichkeiten der Fehlerklassifikation und -vermeidung sowie Methoden der formativen (das heißt antizipierenden) und summativen (das heißt retrospektiven) Qualitätssicherung dargestellt. Hierfür wird der gesamte Prozess, von der Bilddigitalisierung über die Erfassung des Textes, dessen semiautomatische Aufbereitung und Annotation bis hin zur Publikation betrachtet und auf mögliche Fehlerquellen hin untersucht. Aufgrund der gesammelten Projekterfahrungen der vergangenen vier Jahre werden Strategien zur effektiven Vermeidung oder Behebung verschiedener Typen von Fehlern beschrieben.“

von Frank Wiegand, 28. August 2012