Transkriptionen in der alten DigiBib (GenWiki)

Es gibt die Seite Chronik Nettesheim-Butzheim – GenWiki mit zig Unterseiten - eine Seite in jedem Band. Sieht mir nach der Art aus, wie früher Wikisource-Seiten gemacht wurden. Aber alle Seiten sind leer. Das Projekt wurde 2010 angelegt, dann gab es 2017 ein paar kosmetische Korrekturen - seitdem ist es leer.

Für mich stellt sich die Frage, ob wir das heute noch so machen würden. Ob wir das überhaupt machen sollten, oder ob das nicht in der weitaus ausgefeilterten Technik der deutschsprachigen Wikisource unterbringen können - wenn denn jemand wollte.
Wie denkt man hier darüber?

Das ist die Art und weise wie für die Bücher gewissermaßen ein OCR gemacht wurde.

Könntest Du mal aufzeigen welche Seiten leer sind? Ich habe jetzt verschiedene Seiten der Bände geöffnet und da war Text drin.

Vom Prinzip her wird sich die Frage stellen, wenn die Dateien von DjVu weg komme. Ich für mein Teil, weiss noch nicht wie ich mit den Hand gemachten OCR umgehen soll.

Die Seiten stehen unter „unkorrigiert“, Kategorie:Chronik Nettesheim-Butzheim/Band 1 - unkorrigiert – GenWiki

Diese Transkriptionen (gibt auch andere) aus der alten Digibib sollten auf jeden Fall erhalten bleiben. Können sie ins Goobi migriert werden?

Ich finde, es ist gerade der Witz an eine digitalen Bibliothek, dass man dort selber in den Büchern arbeiten kann, also abschreiben, Notizen anfügen, Eselsohren machen - anders als bei einer analogen Bibliothek. Ich kenne mich mit Goobi nicht genug aus, um beurteilen zu können, wieweit Goobi auch für solche Transkriptionen, Glossare usw. fit gemacht werden kann.

Oh, da habe ich nicht gründlich gesucht.

Ich habe in der Spezialseite Kürzeste Seiten unter den ersten Hundert Seiten einige Unterseiten von der Chronik gefunden:
Kurze Seiten – GenWiki. Zum Beispiel Band 2 S. 61 bis 79
Nun stelle ich fest: Es sind nur diese.

Also von der Leere/Vollständigkeit her ist es nicht so wild.

Dennoch gilt die Frage: Gehört das ins GenWiki, oder wäre das nicht woanders besser. Ich würde zuerst an Wikisource denken, wenn ich an Transkriptionen alter deutscher Schriften denke. Als CompGen-Lösung ist Goobi alleine sicherlich besser als das GenWiki.

Gibt es Plugin dafür: Transcription of image content | Goobi workflow Plugins

Da schließe ich mich mal an. Denn in der Cloud liegen einige Transkriptionen aus Archiven.

Ich erinnere mich, dass es für Goobi ein „Crowdsourcing-Modul“ gibt, das genau dafür gedacht ist, dass Benutzer seitenweise transkribieren können, so wie es vor Goobi in der „alten Digibib“, die ja ins GenWiki integriert war, begonnen wurde. Ich erinnere mich auch, dass der Vorstand lange überlegt hat, dieses Modul mit zu kaufen, da es relativ teuer ist (war?). Ob es dann letztlich in dem Paket enthalten ist, das der Verein erworben hat, weiß ich nicht genau, meine aber mich zu erinnern, dass es dabei ist. Horst, Ingrid, Jesper und einige andere müssten das aber wissen.

Viele Grüße
Christopher (Ernestus)

P. S. Vielleicht sollte der Thread umbenannt werden in „Transkriptionen in der alten DigiBib (GenWiki)“ oder ähnlich. Um Nettesheim-Butzheim geht es ja nun wirklich nicht.

Gibt es eine Liste oder Übersicht oder Kategorie solcher Transkriptionsprojekte?

Es gibt auch sogenannten Kampagnen bei denen jeder mitarbeiten kann.

Insgesamt muss man sich das Ganze aber bei bedarf anschauen was man will und was geht und nichts über das Knie brechen.

Es kommt aber darauf an was man will. Mit oder ohne Nutzerbeteiligung.

Die Beschreibung zum nachfolgendem Plugin hat auch was für sich.

Ein nicht unerheblicher Nachteil dieser Kampagnen in Goobie ist, dass man sich dazu in Goobie erst einen Account auf dem Goobieserver anlegen muss. Auch diese Accounts müssten dann verwaltet werden.

Wer weiß denn Genaueres über das Modul, dass CompGen (meines Wissens) mit in dem Paket gekauft hat?

Auch wenn wir zunehmend auf OCR setzen, geht es ja bei dem Crowdsourcing auch um die Korrektur solcher OCR-Texte.

Die folgenden Plugins sind auf dem Workflow installiert. Beim Viewer sehe ich es gerade nicht.

Danke für den Screenshot.

Das betreffende Plugin scheint folgendes zu sein (laut Screenshot anscheinend derzeit bei uns nicht installiert):

„Dieses Step-Plugin erlaubt es, Transkriptionen von Werken zu erstellen. Die Transkriptionen werden dabei ohne Wort- oder Zeilenkoordinaten erfasst.“

Aus der Beschreibung geht hervor, dass hier sowohl rein manuelle Transkriptionen durch Benutzer möglich sind als auch das Korrekturlesen bereits automatisch erstellter OCR-Transkriptionen.

Wenn es derzeit nicht installiert ist, heißt das ja nicht, dass es nicht verfügbar wäre. Laut einer kurzen Recherche, für die ich aber nicht garaniteren kann, wird GPL 2.0 oder neuer Lizenz bereitgestellt, also als Open-Source-Software kostenlos verfügbar sein müsste.

Ob das das Gleiche ist wie „Kampagnen“, weiß ich nicht. Ohne Anmeldung am Server wird wohl gar nichts gehen. Beim GenWiki muss der Benutzer ja auch erst mal einen Account haben.

Eben, es geht hier eigentlich um die ganz grundsätzliche Fragen,
a) ob und wie wir (außerhalb von DES) überhaupt Benutzer-unterstützte Transkriptionen von Inhalten in der DigiBib wollen.
b) wie wir mit abgeschlossenen und begonnenen Transkriptionen aus der alten DigiBib (GenWiki) umgehen. Dass wir diese nicht einfach „unter den Tisch fallen“ lassen, dürfte dabei klar sein.

Das ist zwar auch ein GenWiki-Thema, aber eben auch ein übergreifendes Thema für den Verein.

Das Gefühl Gerhards, das hier etwas über das Knie gebrochen werden soll, habe ich auch manchmal. So als müssten wir hier über ein Stöckchen springen, das uns hingehalten wird, weil gerade mal jemand, der zu jung dabei ist, um die Zusammenhänge und Hintergründe zu kennen, gerne etwas löschen will.

Viele Grüße
Christopher (Ernestus)

Da ich mal wieder angesprochen wurde:
Ich bin nicht zu jung, und schon gar nicht zu jung dabei. Ich habe schon 2013 im GenWiki mitgemacht. Die heutigen Probleme waren schon damals erkennbar.
Es ist auch immer gut, ab und an seine Prozesse zu hinterfragen. Nicht nur die technischen Möglichkeiten entwickeln sich weiter.
Man muss auch nicht „alle Hintergründe und Zusammenhänge“ kennen, um etwas in Bewegung zu setzen. Irgendwas geht immer nicht - bis jemand kommt, der das nicht wusste, und es einfach gemacht hat.
Es ist auch immens wichtig, offen für junge und neue Menschen zu sein. Da braucht man sich gar nicht so despektierlich zu äußern. Wenn hier alle jungen Leute vergrault werden, weil man selbst zu langsam ist, dann stirbt dieser Verein irgendwann aus.
Außerdem halte ich kein Stöckchen hin. Ich habe eine Debatte angestoßen, die bis auf diesen deinen Kommentar bisher sehr produktiv war. Weiß nicht, wo das ein Problem sein soll.

Ich sag’s mal so: auf dem GenWiki liegt eine jahrzehntealte Staubschicht. Die muss mal aufgewirbelt werden. Dabei husten wir alle. Anschließend sehen wir alle klarer.

Als ich in den Vorstand gekommen bin, war das GenWiki ein Riesenproblem, und zwar aus technischen Gründen, weil das Update sich ewig verzögert hatte und dadurch immer schwieriger wurde. @robertpaessler hat das dann in Bewegung gebracht. Vor dem Update kamen auch inhaltliche Neuerungen schon wegen der alten Technik nicht in Schwung.

Die Transkriptionen will aus meiner Sicht niemand löschen, im Gegenteil. Sie sind aber in Gefahr, vergessen zu werden. Zu überlegen ist, ob wir solche Vorhaben weiterhin aktiv betreiben wollen. Es gäbe Argumente dafür, vielleicht auch dagegen.

  • Wenn ja: Der logische Ort wäre Goobi, dann wären die vorhandenen Transkriptionen dorthin zu migrieren, es wären dann Leute zu mobilisieren oder Mitmach-Angebote zu machen, um Neues dort herzustellen.
  • Wenn nein: Dann vielleicht ein Extra-Portal im Genwiki, um die vorhandenen Transkriptionen besser sichtbar zu machen, wenn sie nicht ins CompGen-externe WikiSource abgegeben werden sollen (was ich schade fände).

Rein technisch noch: Änderungen an Artikeln sind über die Versionsgeschichte revidierbar. Beim Komplettlöschen ist es vielleicht besser, ein Momentchen länger zu warten, bis sich die anderen Admins geäußert haben.

Du musst dazu beachten, das dies auf der Ebene des Workflow passiert und nicht im Viewer.

Was Du meinst ist wahrscheinlich so was wie es die zlb nutzt. https://www.intranda.com/digiverso/goobi-viewer/crowdsourcing/

Die komplette Software ist Open-Source. Es gibt meines Wissen nach nur wenige Module/Plugin die was kosten.

Trotzdem würde ich es nicht installieren, weil mir einmal die Kenntnis fehlt und zum anderen haben wir auch einen Supportvertrag.

Was ich überlege ob es was schadet das Plugin installieren zulassen. Mein Gedanke war so oder so mal ein Update der Software in Auftrag zu geben.

Die Gefahr besteht natürlich. Wobei mich das Thema noch nicht so angegangen hat, weil wohl erstmal alle Adressbücher rüber sollten. Um das GenWiki zu entlasten.

Komplettlöschen gibt es in zwei Ausführungen. Was jeder Admin kann ist das Löschen von Seiten. Die können aber auch wieder zurückgeholt/wiederherstellt werden.
Was ich mal angestossen hatte war das tatsächliche Löschen von Seiten https://discourse.genealogy.net/t/loeschen-vieler-seiten-per-bot-oder-aehnliches/817655. Wobei hier auch mein Gedanke ist das GenWiki zu verschlankern.

Ähnliches würde ich gerne bei DjVu machen. https://discourse.genealogy.net/t/medien-bilder-fuer-immer-loeschen/817877. Da gab es zwar Reaktion zum Vorschlag aber so richitg auch nicht.

Ja, möglich, dass das gemeint ist, ich erinnere mich, dass das seinerzeit „Crowdsourcing-Modul“ Thema der Diskussion war - habe das aber nur als Außenstehender von Zeit zu Zeit gehört.

Hallo Michael,

Es geht mir allein um Sachfragen und die entsprechenden Herangehensweisen. Mein Beitrag sollte Dich nicht ad personam angreifen, auch wenn es zugegebenermaßen sehr pointiert formuliert ist. Es bezieht sich übrigens auch nicht nur auf eine einzige Person.

Ich sehe halt das Problem, dass wir durch so eine Vorgehensweise ständig neue Baustellen aufmachen, was dann aber wieder Leute bindet, die gerade und das seit mindestens zwei Jahren, konsequent den sehr mühsamen Weg gehen, bereits bestehende Baustellen abzuarbeiten. Nach kurzer Zeit springen wieder alle auf die nächste neu aufgemachte Baustelle und die vorhergehende bleibt liegen.

Das Thema „Wie gehen wir zukünftig mit Transkriptionen um und wie migrieren wir die vorhandenen (Teil-)Transkriptionen in die neue Welt von Goobi“ ist natürlich eines, das gelöst werden muss. Die Frage ist aber, ob wir genau jetzt, weil gerade jemand „Staub aufwirbelt“ (Dein Zitat) auf genau dieses Problem stürzen sollen - also eine Frage der zeitlichen Priorität. Falls wir jetzt kurzfristig die Lösung dafür finden sollten, wäre ich der letzte, der etwas dagegen hätte. Aber ansonsten läuft uns das Problem nicht weg, wenn nicht gerade etwas gelöscht oder völlig vergessen wird.

Viele Grüße
Christopher

Ok, ich verstehe. Die Baustelle ist unbeabsichtigt eröffnet worden, weil ich fälschlicherweise annahm, dass die Chronik Nettesheim-Butzheim eine Projektruine sei. Gewissermaßen ist sie das, aber eine fast fertige. Ich wusste auch nicht, dass es noch mehr solcher Transkriptionsprojekte im GenWiki gibt.
Da fällt mir ein:

Wie groß ist denn die Baustelle, von der wir hier reden?