Ich möchte meine webtrees basierte Familiendatenbank gerne auch auf GEDBAS darstellen.
Den weitaus größten Teil meiner Daten habe ich selbst über online-Kirchenbücher (Matricula, Archion) zusammengetragen. Leider habe ich meine Quellen dabei überwiegend nur durch als Medien hochgeladene Screenshots der Kirchenbucheinträge, ergänzt durch einen ins Foto eingefügten Link aus Matricula/Archion dokumentiert (Beispiel siehe Anlagen) und keine Quellen-Felder ausgefüllt. Erst seit relativ kurzer Zeit mache ich zusätzlich Angaben in Quellen-Feldern.
Ich fürchte, eine händische Nacharbeit wäre bei über 5000 Personen, ca 1600 Familien und ca. 3000 Medien zu aufwändig.
-
Wäre eine KI-basierte Lösung zum Auslesen der Links und nachträglichen Einfügen als Quellen-Info denkbar bzw. machbar?
-
Hat es einen Wert, die Daten auch ohne Ergänzung in GEDBAS einzustellen?
1 „Gefällt mir“
Sind die Dateien halbwegs eindeutig benannt? Vielleicht lässt sich da ja etwas basteln, dass die Dateinamen der Anhänge ins Quellenfeld einer GEDCOM schreibt, so dieses leer ist
2 „Gefällt mir“
Zu deiner ersten Frage: ja, da geht mit KI sicher etwas. Du kannst etwa ChatGPT ein solches Quellenfoto zeigen (das setzt eventuell die Bezahlversion voraus) und beschreiben welche Informationen man im Bild am oberen Rand sieht. Und dass Du diese Informationen gerne als Tabelle hättest. Wenn das zuverlässig klappt, kannst Du ChatGPT sagen wie aus diesen Informationen ein GEDCOM-Quellendatensatz bzw. ein Quellenzitat aufgebaut werden soll. Das Ergebnis kannst Du dann mit Copy&Paste per RAW-GEDCOM-Bearbeitung in webtrees einfügen.
Zu Deiner zweiten Frage: Ja, das macht immer Sinn. Es gibt ein Erweiterungsmodul für webtrees, das speziell für den Export nach GEDBAS entwickelte Filter enthält. Diese nehmen zB lebende Personen vom Export aus, filtern Quellen und Notizen. Das wird bei der Kooperation zwischen CompGen und GenOnline genutzt.
2 „Gefällt mir“
Guten Morgen Hermann (@schucobn),
Zu Deiner Frage gibt es mehrere Möglichkeiten:
- Wenn sich aus dem Dateinamen oder aus dem Titel im Medienobjekt in webtrees die Herkunft ableiten lässt, dann kann als Quellenangabe zum Bespiel „Kirchenbuchauszug aus Matricula“ hinzugefügt werden. Wenn nicht, kannst Du immer noch als Quelle „Kirchenbuchauszug im Eigenbestand“ verwenden. Das Bild hast Du derzeit direkt dem Ereignis zugeordnet. Ich würde bei einer Umstellung das Bild dem Quellenzitat zuordnen. Ein geeignetes Tool kann bei der Anpassung der GEDCOM hier unterstützen.
- Alternativ kannst Du beim Erstellen der GEDCOM für GEDBAS als Quellenangabe im Personensatz einen Link auf die Person in Deiner webtrees-Anwendung angeben. Wird dann der Link aus GEDBAS ausgeführt, dann sieht der Anwender die Personenansicht der Person wie in Deinem Beispiel dargestellt. Sollte der zugehörige Stammbaum für Besucher nicht freigegeben sein, dann erhält der Anwender die Anmeldeseite und kann sich hierüber direkt an den Admin der Anwendung wenden.
Für die letzt genannte Möglichkeit gibt es für webtrees das Zusatzmodul Extended_Import_Export. Im Auslieferungsumfang des Moduls gibt es auch bereits einen fertigen Filter für einen GEDBAS-Extrakt der BMD-Daten (Geburt/Heirat/Tod) mit den zusätzlichen Links zu den Personen in webtrees.
Viele Grüße
Peter
Sorry, habe eben erst gesehen, dass @Hermann_Hartenthaler die Frage auch schon beantwortet hat.
1 „Gefällt mir“
5/5 sind es jetzt hier, mit meiner Antwort dann 6. Reicht das aus?
Ich würde die Daten so wie sie sind in Gedbas einstellen. Es gibt jede Menge Leute dort, die die Quellen nicht
freigegeben haben, was ich verstehen kann. Wer dann irgendwas findet, das ihn interessiert, der kann sich dann
an den Einsteller wenden. Das wäre für mich die einfachste und sinnvollste Lösung.
KI-Hilfe kannst du ja probieren, Hermann Hartenthaler hat eine Möglichkeit genannt, aber letztlich muss man der
KI dann vertrauen, dass sie alles richtig macht, nicht halluziniert. Ich würde mich nicht darauf verlassen. Und wenn man
dann alle Daten überprüfen müsste, dann könnte man es auch gleich alles selber machen.
Bei so einer Aufgabe halluziniert eine KI nicht, aber sie kann natürlich bei der Erkennung der Zeichen im Bild Fehler machen. Ja, deshalb muss man kontrollieren. Das geht aber viel schneller als selber tippen. Halluzinieren wurde die KI, wenn man ihr sagen würde: denke dir eine zu diesem Bild passende Quellenangabe aus. Aber nicht wenn man ihr sagt: lies was da steht und packe den Text so und so in einen GEDCOM-Quellendatensatz.
Ich hab die KI auch schon bei Texterkennung halluzinieren gesehen.
Ich habe das Halluzinieren schon in so vielen Fällen erlebt, dass ich nie sagen würde sie tut es in diesen oder jenen Fällen nicht.
Letztlich halluziniert sie immer dann, wenn sie eine Antwort geben soll, die sie nicht weiß, also erfindet sie etwas, was leider glaubhaft klingt, aber nicht immer leicht zu überprüfen ist.
Wenn sie Text erkennen soll, es aber nicht richtig kann, dann kann man sagen sie hat da Fehler gemacht. Man könnte auch sagen, sie
hat da etwas erfunden, also halluziniert. Müsste man genauer prüfen, was genau dahintersteckt.
Für den Anwender ist es doch egal, was die Ursache ist: das Ergebnis muss überprüft werden, mit dem Original verglichen werden.
Ich finde nicht, dass es so schneller geht, aber das muss jeder selbst für sich entscheiden, ist wohl auch Geschmackssache.
Hermann_Hartenthaler
- Januar
Bernd.Schmidt:
letztlich muss man der
KI dann vertrauen, dass sie alles richtig macht, nicht halluziniert.
Bei so einer Aufgabe halluziniert eine KI nicht, aber sie kann natürlich bei der Erkennung der Zeichen im Bild Fehler machen. Ja, deshalb muss man kontrollieren. Das geht aber viel schneller als selber tippen. Halluzinieren wurde die KI, wenn man ihr sagen würde: denke dir eine zu diesem Bild passende Quellenangabe aus. Aber nicht wenn man ihr sagt: lies was da steht und packe den Text so und so in einen GEDCOM-Quellendatensatz.
Ganz herzlichen Dank für die vielen konstruktiven Hinweise.
Ich werde jetzt meine Daten erst mal wie sie sind in GEDBAS hochladen.
Unabhängig davon will ich versuchen, die abgebildeten Links aus den Medienobjekten mit ChatGPT auszulesen.
Erste Versuche mit zwei hochgeladenen Dateien waren erfolgreich:
Nicht geklappt haben Versuche, die Links als IPTC-Information in den Foto-Dateien zu speichern:
Vielleicht könnte das mit der Bezahl-Version von ChatGPT klappen.
@Peter_S Ich würde bei einer Umstellung das Bild dem Quellenzitat zuordnen. Ein geeignetes Tool kann bei der Anpassung der GEDCOM hier unterstützen.
meinst Du Gedtool?
Ich würde ChatGPT auch noch nach allen anderen farbigen Metadaten fragen, denn die brauchst Du doch um die Quellenangaben zu erzeugen. Oder?
Dann könnte der Plan so aussehen:
- mit ChatGPT aus den Bilder die Matadaten extrahieren und damit eine große Tabelle aufbauen
- Mit GedTool die GEDCOM in Excel wandeln
- Mit etwas Excel-Voodoo die Tabelle aus Schritt 1 als Quellen und Quellenzitate einflechten
- Und alles zurück nach GEDCOM
Für mich klingt es gut. Und in Excel kann man ganz gut Korrekturlesen, da erkennt man irgendwelche Sonderfälle recht schnell.
2 „Gefällt mir“