ein in Fraktur gedrucktes Buch mit einer Familiengeschichte wurde gescannt, die Scans liegen als PDF vor.
Die Familiendaten sollen in ein Genealogieprogramm eingetragen oder als GEDCOM-Datei importiert werden.
Könnte es mit KI leichter gehen, als die 200-250 Personen mit sämtlichen Angaben abzutippen?
Wie kann welche KI bei den einzelnen Schritten helfen, also
OCR - vermutlich Transkribus,
Personen und die jeweiligen Angaben aus dem Text heraussuchen,
Diese Aufgabe ist viel einfacher für eine KI, da die Dichte der Information geringer ist. Ein paar Personen in einem langen Text zu finden, ist weniger “anstrengend” als ein Kirchenbuch auszuwerten.
Ich würde es erst einmal ohne den Umweg mit Transkribus versuchen. Einfach direkt das pdf auswerten lassen. Wenn das nicht geht, dann kann man immer noch transkribieren, aber eigentlich brauchst Du den transkribierten Text ja gar nicht, wenn Du nur das GEDCOM brauchst. Sinnvoll wäre eine Liste der Personen mit ihren Daten und der Seitennummer wo sie vorkommen. Wenn nicht alle Seiten in einem Wutsch ausgewertet werden können, muss man immer so etwa 10 Seiten auswerten. Aus der Personenliste kann man dann GEDCOM erzeugen. Dann kann man die Fehler in einem Genealogieprogramm von Hand ausbügeln.
Nimm irgendeine KI, so groß sind die Unterschiede nicht. Ich würde ChatGPT nehmen, da weiß ich dass GEDCOM gut funktioniert und da habe ich ein Abo. Aber aus didaktischen Gründen würde ich Dir empfehlen es erst einmal selber zu versuchen, ChatGPT ist ganz gutmütig. Melde dich, wenn du irgendwo nicht weiterkommst. Du kannst aber auch immer ChatGPT fragen: “wie könnte ich hier weiterkommen?”
ich wollte im ersten Schritt die PDF-Datei mit dem Scan hochladen, damit
ChatGPT daraus eine Textdatei macht. Allerdings hat das nicht geklappt,
siehe Fehlermeldung. Ich habe die Datei7,14 MB große Datei geteilt, aber
mit 1 MB klappt es auch nicht.
[Bernhard.Mosolf] Bernhard.Mosolf <genealogy.net
bernhard.mosolf>
15. November
Lege die Datei in eine Cloud. Dann gibst Du sie frei und teilst den Link.
Mit WeTransfer klappt das nicht.
„Ich konnte die Datei nicht direkt öffnen. Du kannst die Scans hier
hochladen, damit ich sie direkt analysieren und den Text daraus
extrahieren kann.“
Für das Transkribieren eines so langen Dokumentes ist ChatGPT nicht ausgelegt. Und Du wolltest doch auch gar kein transkribiertes Textdokument. Aber damit ChatGPT darin lesen kann, musst Du die Datei natürlich an deine Frage als Anhang dran hängen können. Wenn das nicht geht müssen wir ausprobieren ob es nur mit dem Bezahlabo funktioniert. Also den Weg, den Bernhard angesprochen hat.
Ich habs jetzt, wie von ChatGPT empfohlen, mit Google Drive versucht und
im zweiten Anlauf auch bei der Freigabe gewählt „jeder, der über den
Link verfügt“
Antwort:
„Ich konnte die Dateien nicht öffnen, da Google Drive direkten Zugriff
blockiert. Bitte überprüfe die Freigabeeinstellungen der Dateien und
stelle sicher, dass der Zugriff auf „Jeder mit dem Link“ gesetzt ist.
Alternativ kannst du die Dateien hier direkt hochladen, damit ich den
Text für dich extrahieren kann.“
Ich kann aber nicht hochladen! Ist 1 MB immer noch zu groß?
Den Vorschlag ein Bild einer Seite hochzuladen (als Bild, nicht als pdf). Dann wüsstest Du, dass ChatGPT die Schrift lesen kann und die Personendaten rauslesen kann.
Ich habe eben in Google Drive ein Dokument mit “jeder, der den Link kennt” freigegeben. Und dann ChatGPT gefragt um was es im Dokument hinter dem Link geht. Und es hat problemlos geklappt:
Kannst Du das bitte kurz ausprobieren, dann wüssten wir dass dein
ChatGPT prinzipiell auf Google Docs zugreifen kann.
Hier der Ablauf:
Um was geht es in diesem Dokument?
ChatGPT: Ich kann keine externen Links direkt öffnen. Du kannst mir aber
eine Beschreibung des Dokuments geben, oder du kannst den Inhalt hierher
kopieren, damit ich dir genauer sagen kann, worum es geht.
Warum kann ich hier keine Dokumente verlinken?
ChatGPT: Du kannst Links zu Dokumenten hier teilen, aber ich habe keine
direkte Möglichkeit, Google-Dokumente oder andere Links zu öffnen und zu
analysieren. Das liegt daran, dass ich keinen direkten Zugriff auf
externe Inhalte habe, es sei denn, du teilst sie als Datei oder
Textausschnitt hier.
Wenn es ein öffentlich zugängliches Dokument ist, kannst du mir den
relevanten Text oder Inhalt kopieren, oder alternativ die Datei
hochladen, wenn möglich.
Was ist also bei Dir anders als bei mir? Datei hochladen klappt ja auch
nicht. Die verlinkte Datei kann ich öffnen.
Ich habe bei ChatGPT nachgefragt und hier ist die Antwort:
Derzeit unterstützt ChatGPT keine direkte Integration mit externen Dokumenten über freigegebene URLs, wie beispielsweise Google Docs. Das bedeutet, dass ChatGPT nicht in der Lage ist, Inhalte aus solchen Dokumenten direkt zu lesen oder zu verarbeiten.
Allerdings bietet ChatGPT Plus erweiterte Funktionen, darunter die Möglichkeit, Dateien direkt hochzuladen. Mit dieser Funktion können Sie Dokumente wie PDFs oder Word-Dateien direkt in die ChatGPT-Oberfläche hochladen und analysieren lassen. Dies ermöglicht es, spezifische Fragen zum Inhalt des hochgeladenen Dokuments zu stellen oder Zusammenfassungen zu erhalten.
Zusätzlich gibt es Drittanbieter-Tools wie ChatPDF, die es ermöglichen, PDF-Dokumente hochzuladen und mit deren Inhalt zu interagieren. Diese Tools nutzen KI-Technologien, um den Inhalt der hochgeladenen Dateien zu analysieren und Fragen dazu zu beantworten.
Also liegt es daran, dass ich das Plus-Abo habe. Aber Du kannst die kostenlose Erweiterung ChatPDF aktivieren, das habe ich früher auch mal verwendet.
Aber Du kannst die > kostenlose Erweiterung ChatPDF aktivieren, das
habe ich früher auch mal
verwendet.
Habe ich ausprobiert, aber da kommt auch die Fehlermeldung, die Datei
könne nicht gelesen werden. Ich habe die PDF-Datei in jpg umgewandelt,
die konnte ich aber auch nicht hochladen.
Mit Transkribus lassen sich die Bilddateien in Textdateien umwandeln,
wobei das Layout z.T. ein Problem ist (einzelne Listen o.ä.).
Wir müssen jetzt überlegen, wie man da am besten vorgehen kann. Aber
Transkribus ist wohl der nötige erste Schritt. Dann könnte man den Text
immerhin schon durchsuchen.