Österreichisch-Ungarische Verlustlisten: OCR

Lieber Horst,

da Du hier die VL �-U erw�hnst, eine Frage: Warum erkennt OCR seit einiger Zeit die Kombination "verw., kriegsgef." nicht mehr? Fr�her hat das ja auch funktioniert.
Vielleicht k�nnte man das dem Programm (wieder) "beibringen" - wie es ja auch beim kostenlosen ABBYY m�glich ist. Das Positionieren des Cursors in die nicht ausgef�llten Felder ist �u�erst m�hsam und auch fehleranf�llig, insbesondere, wenn der Erfassungsschirm nur zu 1/3 sichtbar ist.

Freundliche Gr��e
Ursula (Faustmann)

Liebe Ursula,

da Du hier die VL Ö-U erwähnst, eine Frage: Warum erkennt OCR seit
einiger Zeit die Kombination "verw., kriegsgef." nicht mehr? Früher hat
das ja auch funktioniert.

auch früher hat das leider nicht regelmäßig gut funktioniert.
Das liegt leider an den teilweise schlechten Vorlagen (altes Papier,
unterschiedliche Tönungen, schlechte Kontraste usw.).
Die OCR-Software und die anschließende nötige Umwandlung für die
Feldbefüllung reagieren da manchmal leider sehr empfindlich. Da hilft es
auch nicht immer, wenn vorher noch mit Photoshop die Scans nachgebessert
werden.

Vielleicht könnte man das dem Programm (wieder) "beibringen" - wie es ja
auch beim kostenlosen ABBYY möglich ist.

Wir können nicht mit Abbyy-Finereader-Pro arbeiten, sondern müssen
unsere Server-Version einsetzen, die in der Lage ist, auch Batch-Dateien
auszuspielen, wo die Positionierungsdaten mit enthalten sind. Dies und
die anschließende Vorbereitung für den Import sind offensichtlich sehr
diffizil.

Das Positionieren des Cursors

in die nicht ausgefüllten Felder ist äußerst mühsam und auch
fehleranfällig, insbesondere, wenn der Erfassungsschirm nur zu 1/3
sichtbar ist.

wenn Du mit Positionierung das Auswählen eines von der OCR nicht
vorbelegten Feldes meinst, gebe ich Dir Recht. Hier sollten wir nochmal
mit unseren Programmierern nach besseren Lösungen suchen. Vielleicht
kann man da eine "intelligente" TAB-Tastensteuerung hinkriegen. Auch da
gibt es ja Vor- und Nachteile.

Was Du mit 1/3 Erfassungsschirm meinst, ist mir nicht klar.
Wir haben den Scan und wir haben die Erfassungsmaske. Den Scan kann ich
doch durch den +- Button verändern?
In einem anderen Projekt laufen im Moment Tests mit einer veränderbaren
Schriftgröße innerhalb der Maske.

Ich möchte mal folgenden Vorschlag machen:
Da Du ja auch schon reichlich Erfahrungen in der ÖUVL hast, solltest Du
mal daraus eine Verbesserungsliste ergänzt durch Beispiele erstellen,
die ich dann an unsere Programmierer weitergeben kann.
Ich bin sicher, so kommen wir dann da auch einen guten Schritt weiter.

Grüße nach Wien

Horst (Reinhardt)

Lieber Horst,

es hat vielleicht fr�her nicht regelm��ig gut funktioniert.
JETZT aber funktioniert es regelm��ig NICHT!

Ich habe auch nicht gesagt, dass Ihr mit ABBYY arbeiten sollt, sondern dass in einem Projekt dieser Gr��e doch wohl das m�glich sein muss, was in einer kostenlosen Version inkludiert ist.

Mit 1/3 Erfassungsschirm meine ich, dass nur 1/3 des Erfassungsschirms zu sehen ist, wenn die Zeilen am unteren Rande des Scans sind, und der Schirm nur "hinaufrutscht", wenn man mit TAB positioniert, was ja in diesem Fall nicht m�glich ist.

Dass Du mir jetzt, nachdem ich monatelang (seit November 2017!!!) immer wieder �nderungs- und Verbesserungsw�nsche an die Projektleitung geschickt habe, die entweder nicht beantwortet oder abgeschmettert wurden, den Vorschlag machst, eine Verbesserungsliste zu erstellen, kann ich nur darauf zur�ckf�hren, dass ich erstmals in einer Mailing-Liste Kritik angebracht habe, in der viele Leute mitlesen k�nnen.

Freundliche Gr��e
Ursula (Faustmann)

da Du hier die VL Ö-U erwähnst, eine Frage: Warum erkennt OCR seit
einiger Zeit die Kombination "verw., kriegsgef." nicht mehr? Früher hat
das ja auch funktioniert.

Des Rätsels Lösung ist vermutlich eine Änderung in den Verlustlisten. In
den frühen Seiten hieß es "verw., kriegsgef." Jetzt steht dort "verw.;
kriegsgef." Für Menschen ein vernachlässigbarer Unterschied, für den
Computer ein völlig anderes Zeichen. Ich habe diese Variante nun mit
aufgenommen, so dass sie bei zukünftigen Einspielungen (nach den schon
vorhandenen 83.000 unfertigen Einträgen) berücksichtigt wird.

Vielleicht könnte man das dem Programm (wieder) "beibringen" - wie es ja
auch beim kostenlosen ABBYY möglich ist.

Wir können nicht mit Abbyy-Finereader-Pro arbeiten, sondern müssen
unsere Server-Version einsetzen, die in der Lage ist, auch Batch-Dateien
auszuspielen, wo die Positionierungsdaten mit enthalten sind.

Leider können wir - und sogar große Nutzer wie Universitätsbibliotheken
- die Produktpolitik der Firma Abbyy nicht beeinflussen. Wir sind in der
glücklichen Lage, dass wir überhaupt noch zwei Lizenzen einer Version
(nämlich Finereader XIX) haben, die Positionierungsdaten mit ausgibt.
Darum beneidet uns so manches Forschungsprojekt aus dem Bereich der
Digital Humanities.

Schöne Grüße
Jesper Zedlitz