Neuerfassung von offline erfassten ABs

(rüberkopiert aus des-betreuer)

Also hier jetzt:

Da würde mich anhand dieses Beispiels mal die nachweisbare Fehlerquote der Offline-Erfassung interessieren und ob diese erneute Erfassung dadurch wirklich zu rechtfertigen ist. Dabei müsstest Du natürlich benennen, was Du als Fehler definierst.

Sollte man nicht lieber erst mal alle noch gar nicht erfassten Bücher mit dem DES erfassen?

Das könnte man tatsächlich an diesen Beispielen gut messen. Mir fehlt dazu aber die Zeit. Vielleicht hat @Georg.Fertig eine Studentin oder einen Studenten, der sich mit dem Thema „Qualität von Citizen Science“ beschäftigen will.

Sollte man nicht lieber erst mal alle noch gar nicht erfassten Bücher mit dem DES erfassen?

Ganz mein Reden. Aber offenbar sehen das manche bei den Leuten, die DES-Projekte betreuen, anders.

Hallo,

Einige bisher offline erfasste Adressbücher wurden mit dem DES neu erfasst. Da wird dann nur die (hoffentlich bessere) DES-Erfassung übernommen.

Ich möchte diese Vorgehensweise unterstützen.

Sollte man nicht lieber erst mal alle noch gar nicht erfassten Bücher mit dem DES erfassen?

Nein, das halte ich für unrealistisch.

Wir haben bislang 469 Adressbücher offline zwischen ca. 2003 und 2013 erfasst und nur ein Teil davon soll mit der DES nacherfasst bzw. ergänzt werden.

https://adressbuecher.genealogy.net/addressbooks/stats

Zwischen 2013 und heute haben wir 388 Adressbücher online erfasst.

https://wiki.genealogy.net/Kategorie:Adressbuch_in_der_Online-Erfassung/fertig

Online Adressbücher sind dem Compgen, Stand heute, aber bereits 10.402 bekannt,

https://wiki.genealogy.net/Kategorie:Online-Adressbuch

davon sind 1.958 in unserer eigenen DigiBib:

https://wiki.genealogy.net/Kategorie:Adressbuch_in_der_DigiBib

Realistisch gesehen werden wir kaum über 10.000 bzw. fast 2000 Adressbücher erfassen können um dann die „Altfälle“ nach zu erfassen, zumal auch die Digitalisierung von Adressbüchern fortschreitet.

Umgekehrt macht es mehr Sinn: nach dem Abarbeiten der „Altfälle“ haben wir eine verbesserte Datenqualität und können uns dann auf die Erfassung weiterer Adressbücher konzentrieren.

Gruß

1 „Gefällt mir“

Frage: Woran machst Du die schlechte Datenqualität der „Altfälle“ fest?

Ich habe jahrelang die Offline-Erfassung betreut. Die Erfassung musste in einer Tabelle mit fest definierten Feldern erfolgen (da war Jesper ziemlich kompromisslos :wink:) Außerdem wurden die Daten beim Hochladen einer maschinellen Prüfung unterzogen, die systemische Fehler aufdeckte und die hochzuladenden Daten abwies.
Es kann also nur um Tippfehler gehen. Und da wurde damals genauso wie heute im DES jeder neue Erfasser erst mal verschärft beobachtet und seine Sorgfalt überprüft.
Wenn mir ein Adressbuch einfällt, das ich vermutlich neu erfassen lassen würde, dann wäre es auf jeden Fall Bielefeld 1931 (das wird oder wurde gerade glaub ich auch neu erfasst?). Damals wurde auf Wunsch des großen Vorsitzenden (wir nannten ihn kpw) ein Versuchsballon gestartet, dieses AB von sehr vielen Erfassern (mit jeweils wenigen Seiten) erfassen zu lassen. Das ganze endete in einer ziemlichen Katastrophe und jeder Menge Arbeit für mich. Aber sonst?

Wie gesagt: Woran machst Du die schlechte Datenqualität der „Altfälle“ fest?

Und ganz nebenbei: Wenn ein Adressbuch zusätzlich zur Alterfassung als Digitalisat vorliegt, kann jeder überprüfen, ob der jeweilige Datensatz korrekt erfasst wurde, und wenn es nicht als Digitalisat vorliegt, könnt ihr es mit dem DES nicht erfassen.

Da hast Du mich jetzt völlig falsch verstanden. Ich habe die Qualität der offline-Erfassung als solche nicht in Frage gestellt.

Einige bisher offline erfasste Adressbücher wurden mit dem DES neu erfasst.

Ich beziehe mich auf diese Aussage von Jesper. Es gibt offensichtlich Adressbücher, die neu erfasst werden müssen/mussten.

In meinem Beitrag ging es lediglich um die Reihenfolge der Erfassung.