Anmelden (DTAQ) DWDS     dlexDB     CLARIN-D

DTA-Nachrichten vom 7. Mai 2019

Das DTA-Basisformat bekommt Verstärkung

Das DTA-Basisformat (DTABf) ist ein Format zur Auszeichnung historischer Drucke mit einer Erweiterung für Handschriften auf Basis der TEI-P5-Richtlinien, das vor allem für den Aufbau und die Erschließung historischer Volltextkorpora genutzt wird. Es schränkt die Richtlinien der TEI so ein, dass Ambiguitäten im Tagging vermieden werden, während weiterhin eine möglichst große Anzahl von Phänomenen der Vorlage modelliert werden kann. Mit der Ausarbeitung des DTABf unterbreiten wir einen Vorschlag für einen Standard zur Volltext-Aufbereitung historischer Texte.

Das DTABf soll die Kompatibilität und Interoperabilität von digitalisierten Texten stärken und so einen Beitrag leisten, um homogen aufbereitete und qualitativ hochwertige Forschungsdaten für die Wissenschaft bereitzustellen und nachnutzbar zu machen.

Zunehmend wird das DTABf, das im Projektkontext des DTA entstand, auch von externen Projekten verwendet. Damit steigt der Bedarf, das Format für Kontexte außerhalb des korpuslinguistischen Fokus des DTA zusätzlich nutzbar zu machen. Um dieser Entwicklung gerecht zu werden, wurde eine Steuerungsgruppe gegründet, deren Mitglieder durch ihre Verankerung in verschiedenen Communities unterschiedliche Perspektiven und Expertisen bei der Weiterentwicklung des Formats einbringen können.

Die DTABf-Steuerungsgruppe setzt sich aus Expertinnen und Experten für TEI-Auszeichnung und -Anpassung zusammen. Sie gehörten zum Teil bereits dem ursprünglichen Team des DTA an; zum Teil repräsentieren sie andere Projekte, die ebenfalls das DTA-Basisformat einsetzen. Mitglieder sind Matthias Boenig (BBAW, OCR-D), Daniel Burckhardt (GHI Washington DC), Stefan Dumont (BBAW, Telota), Alexander Geyken (BBAW, DWDS & ZDL), Martina Goedel (textloop & CCEH), Susanne Haaf (BBAW, ZDL & t.evo), Axel Herold (BBAW, ZHistLex & DWDS/ZDL), Christian Thomas (BBAW, CLARIN-D & edition humboldt digital).

Die DTABf-Steuerungsgruppe trifft sich regelmäßig, um Entwicklungen am DTA-Basisformat abzustimmen und über neue Vorschläge zu entscheiden. Im Fokus stehen dabei die Erweiterungs- und Änderungsvorschläge der Nutzenden, die über Tickets auf der GitHub-Präsenz des DTABf gemeldet werden. Alle Vorschläge werden vor dem Hintergrund der DTABf-Leitlinien beraten.

von Susanne Haaf, 7. Mai 2019