Gescannten Text (PDF) weiterverarbeiten

Renate_E · 15. November 2024 um 09:04

Liebe KI-Kennende,

ein in Fraktur gedrucktes Buch mit einer Familiengeschichte wurde gescannt, die Scans liegen als PDF vor.

Die Familiendaten sollen in ein Genealogieprogramm eingetragen oder als GEDCOM-Datei importiert werden.

Könnte es mit KI leichter gehen, als die 200-250 Personen mit sämtlichen Angaben abzutippen?
Wie kann welche KI bei den einzelnen Schritten helfen, also

OCR - vermutlich Transkribus,
Personen und die jeweiligen Angaben aus dem Text heraussuchen,
GEDCOM erstellen.

Mit der GEDCOM wird es wohl schwierig (siehe Kirchenbuch als PDF in GEDCOM Format umwandeln), aber die Personen herauszusuchen und aufzulisten wäre schon eine Hilfe.

Das Buch enthält auch eine handschriftliche Ahnentafel im Posterformat, die jeweils in Ausschnitten fotografiert wurde.

Schöne Grüße,
Renate

Bernhard.Mosolf · 15. November 2024 um 09:19

Kannst Du Beispiele hier rein stellen? Mit PDF können viele KI recht gut umgehen.

Hermann_Hartenthaler · 15. November 2024 um 09:58

Diese Aufgabe ist viel einfacher für eine KI, da die Dichte der Information geringer ist. Ein paar Personen in einem langen Text zu finden, ist weniger “anstrengend” als ein Kirchenbuch auszuwerten.

Ich würde es erst einmal ohne den Umweg mit Transkribus versuchen. Einfach direkt das pdf auswerten lassen. Wenn das nicht geht, dann kann man immer noch transkribieren, aber eigentlich brauchst Du den transkribierten Text ja gar nicht, wenn Du nur das GEDCOM brauchst. Sinnvoll wäre eine Liste der Personen mit ihren Daten und der Seitennummer wo sie vorkommen. Wenn nicht alle Seiten in einem Wutsch ausgewertet werden können, muss man immer so etwa 10 Seiten auswerten. Aus der Personenliste kann man dann GEDCOM erzeugen. Dann kann man die Fehler in einem Genealogieprogramm von Hand ausbügeln.

Bernhard.Mosolf · 15. November 2024 um 10:27

Daher ja das Beispiel. Fraktur sollte keinerlei Problem darstellen, sag ich jetzt so einfach.

Renate_E · 15. November 2024 um 10:51

Würdet Ihr das ausprobieren? Ihr nennt ja keine KI, mit der ich es
ausprobieren kann. Ich hab da auch keinerlei Erfahrung.

Grüße,
Renate

Hermann_Hartenthaler · 15. November 2024 um 11:14

Nimm irgendeine KI, so groß sind die Unterschiede nicht. Ich würde ChatGPT nehmen, da weiß ich dass GEDCOM gut funktioniert und da habe ich ein Abo. Aber aus didaktischen Gründen würde ich Dir empfehlen es erst einmal selber zu versuchen, ChatGPT ist ganz gutmütig. Melde dich, wenn du irgendwo nicht weiterkommst. Du kannst aber auch immer ChatGPT fragen: “wie könnte ich hier weiterkommen?”

Renate_E · 15. November 2024 um 11:27

Es gibt ja ein paar Vorlagen oder Hinweise, wie man so was machen kann,
ich probiere es.

Bernhard.Mosolf · 15. November 2024 um 15:18

Das zeichnet Dich aus!

Viel Erfolg.

Renate_E · 15. November 2024 um 21:13

Hallo,

ich wollte im ersten Schritt die PDF-Datei mit dem Scan hochladen, damit
ChatGPT daraus eine Textdatei macht. Allerdings hat das nicht geklappt,
siehe Fehlermeldung. Ich habe die Datei7,14 MB große Datei geteilt, aber
mit 1 MB klappt es auch nicht.

Weiß jemand, wie ich hier weiterkomme?

Schöne Grüße,
Renate

(Anhänge)

Bernhard.Mosolf · 15. November 2024 um 21:17

Lege die Datei in eine Cloud. Dann gibst Du sie frei und teilst den Link.

Renate_E · 15. November 2024 um 22:09

[Bernhard.Mosolf] Bernhard.Mosolf <genealogy.net
bernhard.mosolf>
15. November

Lege die Datei in eine Cloud. Dann gibst Du sie frei und teilst den Link.

Mit WeTransfer klappt das nicht.
„Ich konnte die Datei nicht direkt öffnen. Du kannst die Scans hier
hochladen, damit ich sie direkt analysieren und den Text daraus
extrahieren kann.“

Hermann_Hartenthaler · 15. November 2024 um 22:10

Für das Transkribieren eines so langen Dokumentes ist ChatGPT nicht ausgelegt. Und Du wolltest doch auch gar kein transkribiertes Textdokument. Aber damit ChatGPT darin lesen kann, musst Du die Datei natürlich an deine Frage als Anhang dran hängen können. Wenn das nicht geht müssen wir ausprobieren ob es nur mit dem Bezahlabo funktioniert. Also den Weg, den Bernhard angesprochen hat.

Hermann_Hartenthaler · 15. November 2024 um 22:13

… ok, Du kannst auch dem Vorschlag von ChatGPT folgen. Mach von einer typischen Seite einen Screenshot und lass den von der KI auswerten.

Renate_E · 15. November 2024 um 22:21

Ich habs jetzt, wie von ChatGPT empfohlen, mit Google Drive versucht und
im zweiten Anlauf auch bei der Freigabe gewählt „jeder, der über den
Link verfügt“

Antwort:
„Ich konnte die Dateien nicht öffnen, da Google Drive direkten Zugriff
blockiert. Bitte überprüfe die Freigabeeinstellungen der Dateien und
stelle sicher, dass der Zugriff auf „Jeder mit dem Link“ gesetzt ist.
Alternativ kannst du die Dateien hier direkt hochladen, damit ich den
Text für dich extrahieren kann.“

Ich kann aber nicht hochladen! Ist 1 MB immer noch zu groß?

Renate_E · 15. November 2024 um 22:48

Mein Gedanke war: Erst vom Bild zum Text, dann den Text auswerten lassen
(den wir vielleicht auch gebrauchen können).

Ja, die Datei ist umfangreich. Sonst bräuchte ich auch keine KI, sondern
würde es einfach eintippen.

Ich habe es jetzt mit zwei Seiten versucht, die kann ich auch nicht als
PDF hochladen. An der Größe scheint es nicht zu liegen.

[Hermann_Hartenthaler] Hermann_Hartenthaler <https://
discourse.genealogy.net/u/hermann_hartenthaler>
15. November

… ok, Du kannst auch dem Vorschlag von ChatGPT folgen. Mach von einer
typischen Seite einen Screenshot und lass den von der KI auswerten.

Welcher Vorschlag?
Und was würde das nützen?

Ratlos,
Renate

Hermann_Hartenthaler · 15. November 2024 um 23:09

Den Vorschlag ein Bild einer Seite hochzuladen (als Bild, nicht als pdf). Dann wüsstest Du, dass ChatGPT die Schrift lesen kann und die Personendaten rauslesen kann.

Ich habe eben in Google Drive ein Dokument mit “jeder, der den Link kennt” freigegeben. Und dann ChatGPT gefragt um was es im Dokument hinter dem Link geht. Und es hat problemlos geklappt:

Um was geht es im folgenden Dokument: Johanna Wiedmann - Euthanasie-Opfer - Google Docs

Kannst Du das bitte kurz ausprobieren, dann wüssten wir dass dein ChatGPT prinzipiell auf Google Docs zugreifen kann.

Renate_E · 16. November 2024 um 16:16

Danke, Hermann.

[Hermann_Hartenthaler] Hermann_Hartenthaler <https://
discourse.genealogy.net/u/hermann_hartenthaler>

Kannst Du das bitte kurz ausprobieren, dann wüssten wir dass dein
ChatGPT prinzipiell auf Google Docs zugreifen kann.

Hier der Ablauf:

Um was geht es in diesem Dokument?

ChatGPT: Ich kann keine externen Links direkt öffnen. Du kannst mir aber
eine Beschreibung des Dokuments geben, oder du kannst den Inhalt hierher
kopieren, damit ich dir genauer sagen kann, worum es geht.

Warum kann ich hier keine Dokumente verlinken?
ChatGPT: Du kannst Links zu Dokumenten hier teilen, aber ich habe keine
direkte Möglichkeit, Google-Dokumente oder andere Links zu öffnen und zu
analysieren. Das liegt daran, dass ich keinen direkten Zugriff auf
externe Inhalte habe, es sei denn, du teilst sie als Datei oder
Textausschnitt hier.
Wenn es ein öffentlich zugängliches Dokument ist, kannst du mir den
relevanten Text oder Inhalt kopieren, oder alternativ die Datei
hochladen, wenn möglich.

Was ist also bei Dir anders als bei mir? Datei hochladen klappt ja auch
nicht. Die verlinkte Datei kann ich öffnen.

Schöne Grüße,
Renate

Hermann_Hartenthaler · 16. November 2024 um 18:40

Ich habe bei ChatGPT nachgefragt und hier ist die Antwort:

Derzeit unterstützt ChatGPT keine direkte Integration mit externen Dokumenten über freigegebene URLs, wie beispielsweise Google Docs. Das bedeutet, dass ChatGPT nicht in der Lage ist, Inhalte aus solchen Dokumenten direkt zu lesen oder zu verarbeiten.

Allerdings bietet ChatGPT Plus erweiterte Funktionen, darunter die Möglichkeit, Dateien direkt hochzuladen. Mit dieser Funktion können Sie Dokumente wie PDFs oder Word-Dateien direkt in die ChatGPT-Oberfläche hochladen und analysieren lassen. Dies ermöglicht es, spezifische Fragen zum Inhalt des hochgeladenen Dokuments zu stellen oder Zusammenfassungen zu erhalten.

Zusätzlich gibt es Drittanbieter-Tools wie ChatPDF, die es ermöglichen, PDF-Dokumente hochzuladen und mit deren Inhalt zu interagieren. Diese Tools nutzen KI-Technologien, um den Inhalt der hochgeladenen Dateien zu analysieren und Fragen dazu zu beantworten.

Also liegt es daran, dass ich das Plus-Abo habe. Aber Du kannst die kostenlose Erweiterung ChatPDF aktivieren, das habe ich früher auch mal verwendet.

Renate_E · 16. November 2024 um 19:44

Hallo Hermann,

danke für Deine Unterstützung.

[Hermann_Hartenthaler] Hermann_Hartenthaler <https://
discourse.genealogy.net/u/hermann_hartenthaler>
16. November

Also liegt es daran, dass ich das Plus-Abo habe.

Ich habe schon so was vermutet.

Aber Du kannst die > kostenlose Erweiterung ChatPDF aktivieren, das
habe ich früher auch mal
verwendet.

Habe ich ausprobiert, aber da kommt auch die Fehlermeldung, die Datei
könne nicht gelesen werden. Ich habe die PDF-Datei in jpg umgewandelt,
die konnte ich aber auch nicht hochladen.

Mit Transkribus lassen sich die Bilddateien in Textdateien umwandeln,
wobei das Layout z.T. ein Problem ist (einzelne Listen o.ä.).

Wir müssen jetzt überlegen, wie man da am besten vorgehen kann. Aber
Transkribus ist wohl der nötige erste Schritt. Dann könnte man den Text
immerhin schon durchsuchen.

Schönen Abend,
Renate

Bernhard.Mosolf · 16. November 2024 um 20:20

Kannst Du mir im einer PM den Link zur Datei schicken?