Da würde mich anhand dieses Beispiels mal die nachweisbare Fehlerquote der Offline-Erfassung interessieren und ob diese erneute Erfassung dadurch wirklich zu rechtfertigen ist. Dabei müsstest Du natürlich benennen, was Du als Fehler definierst.
Sollte man nicht lieber erst mal alle noch gar nicht erfassten Bücher mit dem DES erfassen?
Das könnte man tatsächlich an diesen Beispielen gut messen. Mir fehlt dazu aber die Zeit. Vielleicht hat @Georg.Fertig eine Studentin oder einen Studenten, der sich mit dem Thema „Qualität von Citizen Science“ beschäftigen will.
Sollte man nicht lieber erst mal alle noch gar nicht erfassten Bücher mit dem DES erfassen?
Ganz mein Reden. Aber offenbar sehen das manche bei den Leuten, die DES-Projekte betreuen, anders.
Realistisch gesehen werden wir kaum über 10.000 bzw. fast 2000 Adressbücher erfassen können um dann die „Altfälle“ nach zu erfassen, zumal auch die Digitalisierung von Adressbüchern fortschreitet.
Umgekehrt macht es mehr Sinn: nach dem Abarbeiten der „Altfälle“ haben wir eine verbesserte Datenqualität und können uns dann auf die Erfassung weiterer Adressbücher konzentrieren.
Frage: Woran machst Du die schlechte Datenqualität der „Altfälle“ fest?
Ich habe jahrelang die Offline-Erfassung betreut. Die Erfassung musste in einer Tabelle mit fest definierten Feldern erfolgen (da war Jesper ziemlich kompromisslos ) Außerdem wurden die Daten beim Hochladen einer maschinellen Prüfung unterzogen, die systemische Fehler aufdeckte und die hochzuladenden Daten abwies.
Es kann also nur um Tippfehler gehen. Und da wurde damals genauso wie heute im DES jeder neue Erfasser erst mal verschärft beobachtet und seine Sorgfalt überprüft.
Wenn mir ein Adressbuch einfällt, das ich vermutlich neu erfassen lassen würde, dann wäre es auf jeden Fall Bielefeld 1931 (das wird oder wurde gerade glaub ich auch neu erfasst?). Damals wurde auf Wunsch des großen Vorsitzenden (wir nannten ihn kpw) ein Versuchsballon gestartet, dieses AB von sehr vielen Erfassern (mit jeweils wenigen Seiten) erfassen zu lassen. Das ganze endete in einer ziemlichen Katastrophe und jeder Menge Arbeit für mich. Aber sonst?
Wie gesagt: Woran machst Du die schlechte Datenqualität der „Altfälle“ fest?
Und ganz nebenbei: Wenn ein Adressbuch zusätzlich zur Alterfassung als Digitalisat vorliegt, kann jeder überprüfen, ob der jeweilige Datensatz korrekt erfasst wurde, und wenn es nicht als Digitalisat vorliegt, könnt ihr es mit dem DES nicht erfassen.