ChatGPT “spricht” GEDCOM - Revolutionäre Möglichkeiten für die Genealogie

@Hermann_Hartenthaler ich hatte mir das Projekt eigentlich fürs Wochenende vorgenommen. Aber ja, der Abend ist noch jung und die Ahnen sind geduldig.
Gern gemeinsam und mit Deiner Unterstützung. Ich melde mich, wenn es hakt oder ich die ersten Ergebnisse habe.

1 „Gefällt mir“

Ein erstes Ergebnis mit minimalem Aufwand:
Der Ausgangstext war ein Teil einer Chronik, in der der Lebensweg des Johann Philipp Bohner beschrieben wird.

Meine Eingabe:

Ergebnis:

Das hat Potential. Man stelle sich vor, man kann in einer unlimitierten Version der KI eine ganze Chronik verarbeiten und in vielen Teilschritten oder womöglich auch „in einem Rutsch“ die (Teil-)Biografien von allen darin enthaltenen Personen erstellen lassen.

Es folgt das Hexenwerk.

Dann habe ich Kopf und Ende hinzufügen lassen, als Gedcom abgespeichert und in Webtrees eingelesen.

Ergebnis:

Warum bei jedem Beruf der Verweis zur vermeintlichen Familie erfolgt, muss man sich ansehen. Aber ich bin mir ziemlich sicher, dass die KI diesen Fehler korrigiert, wenn man die entsprechende Eingabe macht. Das Geschlecht fehlt auch, aber ich hatte auch nichts vorgegeben.

Bei Wohnsitz lautet der GEDCOM-Schnipsel in Webtrees:

1 RESI
2 DATE FROM 1632
2 PLAC Kronenburg

Statt „from“ müsste es „aft“ heißen.
Aber das sind Kleinigkeiten. Wenn man einmal ausprobiert hat, welche Eingaben in welcher Reihenfolge erfolgen müssen, dann dürfte das Ergebnis nahe an perfekt sein.

Bohner aft

Die KI weiß, was sie tut. :grinning:

2 „Gefällt mir“

Bin weiterhin einfach nur begeistert.

1 „Gefällt mir“

Hinweise:

  1. Morgen um 17:00 Uhr
    10 ChatGPT Prompts Every Genealogist Needs to Know | Findmypast

  2. Blog
    ChatGPT and GEDCOM Files

Moin
Kann das sein das die erste Veranstaltung um 8:00 morgens mitteleuropäischer Zeit standfindet?

Ah schon gut vergisst es… verguggt. :flushed:
Viele Grüße Christian

Ein neuer Test mit einer anderen Quelle.
Ausgangspunkt ist eine fotografierte Seite aus dem Pfarrerbuch Sachsen, Bd. 2 S. 103.

Diese Seite habe ich zunächst in eine pdf-Datei und dann mit dem kostenlosen OCR-Tool von Horland in eine durchsuchbare pdf-Datei umgewandelt. Anschließend copy&paste des Eintrages „Christoph Werner Jacob Bünger“ in eine Worddatei. Da die Linien nicht gleichmäßig sind, war etwas Nacharbeit erforderlich. Würde man dieses Buch aber mit einem Buchscanner scannen, wäre das Ergebnis perfekt (so ausprobiert bei o.g. Beispiel Bohner aus einer Chronik).

Anschließend wurde die KI mit den bekannten Aufgaben gefüttert und im Ergebnis habe ich diese GEDCOM erhalten.

Bünger.ged (1,7 KB)

In Webtrees sieht das so aus:

Es fehlen zwei Kinder, die die KI aber auf Aufforderung nachträgt. Grund für das vorläufige Fehlen ist die Anordnung in der Ursprungstabelle. Da wurden - sicherlich aufgrund der Vorlage - erst die Schwiegereltern und dann die letzten beiden Kinder aufgelistet. Beim Erstellen der Gedcom hat die KI diese beiden dann aber „vergessen“.

Das Ergebnis kann nur so gut wie die Quelle selbst sein. Steht im Pfarrerbuch als Ortsbezeichnung „ebd.“, dann übernimmt die KI das natürlich genauso. Aber es wird als Ort erkannt, das finde ich ganz erstaunlich. Die verwandtschaftlichen Beziehungen (Eltern, Kinder und sogar die Schwiegereltern) wurden richtig erkannt.

Wer wagt einen Blick in die Zukunft? Wo stehen wir in einem Jahr?

3 „Gefällt mir“

Noch ein Hinweis: Für den Fall, dass die Antwort des Modells mittendrin abbricht (vermutlich weil sie zu lang wird), gibt es im Netz den Tipp, die Aufforderung „fahre fort“ einzugeben. Das funktioniert manchmal, aber anscheinend nicht immer, und manchmal sieht die Fortsetzung anders aus als der Anfang.

1 „Gefällt mir“

Hallo Silvia,

Ja leider, daher hab ich versucht ihm eine GEDCOM in 11 Teilen unterzujubeln, aber ich bin kläglich gescheitert. Egal wie viele mal ich ihm erklärt habe das er alle 11 Teile berücksichtigen soll, hatte gpt sich immer Phantasienamen ausgedacht oder sich geweigert die GEDCOM als ein file zu erkennen… oder meine prompts waren nicht gut genug.
:smirk:

Gruß Christian

1 „Gefällt mir“

Was vor zwei Wochen noch galt, ist heute schon wieder überholt. Für erste ausgewählte Nutzer steht jetzt ein neues Zusatzmodul (PlugIn) für ChatGPT bereit: Wolfram Alpha. Wolfram Alpha ist eine schon länger verfügbare semantische Suchmaschine. Die Ergebnisse sind synthetische Antworten, von der simplen Berechnung der Summe von ein paar Zahlen bis zu Eigenwerten von Differenzialgleichungen oder Umlaufbahnen von Planeten. Ich habe mich zur Nutzung des PlugIns angemeldet, warte aber noch.

Damit ist überholt, was bisher ChatGPT auszeichnete: das Tool ist gut im Bearbeiten und Verfassen von Texten, weiß aber nicht was wahr und was falsch ist, hat keine Ahnung von der tatsächlichen Welt, kann nicht rechnen und kennt sich nicht mit Geografie, Physik, etc aus. Mit Wolfram|Alpha ist das nun völlig anders: man kann nun in ChatGPT fragen:

  • „Um wieviel Grad ist es heute in Freiburg kälter als in Berlin“ und bekommt die richtige Antwort: „Heute ist es in Freiburg im Breisgau um 6 Grad kälter als in Berlin.“

  • „Berechne das Integral von x² cos(2x)“

  • „Zeige mir die Riemannsche Zeta-Funktion im Bereich von 0 bis 50“
    image

  • „Wo stehen die Jupiter-Monde im Moment?“

  • „Zeige mit in einer Grafik wie ich mit einem Großonkel zweiten Grades verwandt bin.“

  • … und vieles mehr!

Insbesondere unterstützt die Wolfram Language SOAP-Web-Dienste, so dass es möglich sein sollte, ChatGPT über Wolfram mit GOV zu verbinden. Damit müsste es möglich sein, dass man ChatGPT bittet aus einer GEDCOM-Datei eine Lebensgeschichte zu einem Vorfahren zu verfassen. Wenn der Vorfahr nun 1860 in Freiburg im Breisgau lebte, müsste ChatGPT aus GOV wissen, dass dieser Ort zu der Zeit zum Freistaat Baden gehörte. Mal sehen.

Auf jeden Fall sind nun beide Welten, die „phantastische“ ChatGPT-Welt und die exakte, etwas hölzerne Wolfram-Welt vereint: das Beste aus zwei Welten.

Und die Konkurrenz legt auch einen Zahn zu: Google kommt nun auch.

Das habe ich nun einmal gemacht. In webtrees kann man sehr einfach Teile des Stammbaumes ausschneiden und in einen Sammelbehälter legen, den man dann u.a. als GEDCOM-Datei exportieren kann. Also habe ich die Angaben zu meinem Großvater, seinen Eltern, seinen Geschwistern und zu seinem Halbbruder in den Sammelbehälter gepackt, und habe dann zur Vereinfachung die Verweise auf die Mediendateien, die Quellen und die _LOC-Ortsdatensätze im Sammelbehälter gelöscht und den Rest exportiert. Nach dem Entfernen von Kopf und Trailer und den Änderungshinweisen (CHAN-Datensätze) verblieben 170 Zeilen GEDCOM, die ich dann an ChatGPT übergeben habe.

Prompt:

Verfasse als Rudolf Hartenthaler Deine Biografie in der Ich-Erzählform. Gehe auch auf Deine Eltern und Geschwister ein. Verwende die Angaben aus der folgenden GEDCOM-Datei.
0 @I676@ INDI
1 NAME Josef /Hartenthaler/
2 GIVN Josef
2 SURN Hartenthaller, Hartenthaler

0 @F224@ FAM
1 MARR
2 DATE 21 AUG 1892
1 HUSB @I676@
1 WIFE @I685@
1 CHIL @I686@
1 CHIL @I678@
1 CHIL @I669@
0 @F225@ FAM
1 HUSB @I687@
1 WIFE @I685@
1 CHIL @I688@
1 _NMR Y
1 _STAT NOT MARRIED

ChatGPT:

Ich bin Rudolf Hartenthaler, geboren am 23. Februar 1901 in Linz, Oberösterreich, Österreich. Meine Eltern waren Josef Hartenthaler und Juliana Keplinger. Mein Vater, Josef Hartenthaler, wurde am 18. März 1863 in Hofberg, Frankenburg am Hausruck, Oberösterreich, geboren. Er war ein Pferdeknecht und später als Arbeiter in einer Fabrik tätig. Leider nahm er sich am 1. August 1932 in Ebelsberg, Linz, das Leben, indem er ertrank. Meine Mutter, Juliana Keplinger, wurde am 2. Dezember 1861 in Walding, Urfahr-Umgebung, Oberösterreich, geboren. Sie arbeitete als Magd bei Stadtbauern in Linz, bevor sie meinen Vater heiratete. Juliana verstarb am 11. Juni 1934 in Linz.
Ich hatte zwei Geschwister. Meine Schwester Maria Hartenthaler wurde am 2. Mai 1893 in Linz geboren. Sie wurde eine erfolgreiche Gemischtwarenhändlerin und zog später nach Wien, wo sie 1974 verstarb und auf dem Neustifter Friedhof beerdigt wurde. Mein Bruder Josef Hartenthaler wurde am 30. November 1896 in Linz geboren. Er war Sattler von Beruf und arbeitete ebenfalls in einer Fabrik. Leider verstarb er früh am 14. Mai 1922.
Ich selbst führte ein abwechslungsreiches Leben. Nachdem ich die Schule abgeschlossen hatte, erlernte ich den Beruf des Schuhmachers. Später fand ich eine Anstellung bei den Österreichischen Bundesbahnen (ÖBB) im Fernmeldedienst. Ich war auch an der Errichtung der Fernmeldeanlagen im Bahn-Kraftwerk Kaprun beteiligt. Später arbeitete ich als Portier in der Fernmeldestelle der Bahn in der Frankstraße in Linz. Im Januar 1977 trat ich in den Ruhestand und verbrachte meine letzten Jahre im Seniorenzentrum Spallerhof in Linz, wo ich am 25. Januar 1995 verstarb. Meine sterblichen Überreste wurden eingeäschert und auf dem Urfahr-Friedhof in Linz beigesetzt.
Ich bin stolz auf meine Familie und die Arbeit, die ich in meinem Leben geleistet habe. Trotz der Höhen und Tiefen habe ich versucht, mein Bestes zu geben und mein Schicksal selbst in die Hand zu nehmen.

Ich bin mit dieser Biografie sehr zufrieden. Der Text list sich ganz gut. Mein Prompt war nicht sehr restriktiv, so dass einige freie Formulierungen wie im letzten Absatz ok sind. Ich hätte auch fordern können: „Verwende nur die Angaben aus der GEDCOM-Datei.“.

Was fällt mir auf? Die in der GEDCOM-Datei verwendete Landesbezeichnung „AUT“ wird in der Biografie in Österreich umgesetzt. Fein. Bei nachfolgenden Ortsangaben, die alle zu Österreich gehören, wird das Land nicht jedes mal wiederholt. Das liest sich besser. Fein. Schön finde ich die Formulierung „bevor sie meinen Vater heiratete“. Das kann man tatsächlich aus den angegebenen Datumsangaben so folgern. Ist vielleicht nicht 100% richtig in der Logik, aber ist sehr naheliegend.

Auf den Halbbruder Franz geht die Biografie nicht ein, obwohl alle Angaben dazu in der GEDCOM enthalten sind. Ich habe das im Nachgang in einem Prompt explizit angefordert, musste dann aber erst noch erklären was ein Halbbruder ist, bevor es - nach der für ChatGPT typischen Entschuldigung - eine Ergänzung gab:

Zusätzlich zu meinen Geschwistern hatte ich auch einen Halbbruder namens Franz Kepplinger, der ebenfalls von meiner Mutter Juliana Keplinger stammt. Franz wurde am 24. November 1890 in Gramastetten, Oberösterreich, geboren. Er war Sattler und später als Kraftfahrer bei ESG (Verkehrsbetrieb der Stadt Linz) tätig. Franz verstarb am 3. November 1960 in Linz und wurde im Urnenhain Urfahr beigesetzt.

Der Bruder Josef verstarb im Alter von 25 Jahren, das kommentiert ChatGPT zutreffend mit „verstarb er früh“. Der berufliche Werdegang meinse Großvaters ist in mehreren OCCU und NOTE-Einträgen hinterlegt. Die zusammenfassende Aufstellung von ChatGPT finde ich super gut gelungen. Der einzige falsche Satz ist „… und verbrachte meine letzten Jahre im Seniorenzentrum Spallerhof“. Das ist nicht wirklich mit Daten hinterlegt, widerspricht ihnen aber auch nicht. Die von ChatGPT geäußerte Vermutung ist aber falsch. Mein Großvater war nur die letzten Monate seines Lebens dort. Ich sollte also in webtrees diese letzte Lebensphase mal etwas genauer modellieren.

Mein Fazit: sehr gut gelungen und besser als alles was ich bisher aus den Daten generiert habe (etwa unter Nutzung des webtrees Moduls FancyTreeView oder des Programms The Complete Genealogy Reporter (TCGR)).

2 „Gefällt mir“

Hallo zusammen, habe mal einen Versuch mit meinen Daten gemacht. Kann das Ergebnis hier nicht veröffentlichen, da noch lebende Personen betroffen sind. Für einen ersten Versuch nicht mal so schlecht, wenn man davon absieht, dass ChatGPT unseren Schwiegersohn zu einem unehelichen Kind meiner Frau gemacht hat.

1 „Gefällt mir“

Ich würde keine vertraulichen Daten an eine KI weitergeben. Die Nutzungsbedingungen sehen üblicherweise vor, dass die übergebenen Daten für das weitere Training der KI genutzt werden dürfen. Das heißt, dass die KI die vertraulichen Informationen lernt. Und jeder andere Nutzer, der die KI fragt, kann diese vertraulichen Informationen dann ggf. abfragen.

2 „Gefällt mir“

Was verstehen sie unter vertraulichen Daten?

Gruß Georg Klein

1 „Gefällt mir“

Zum Beispiel Daten von lebenden Personen.

Viele Grüße
Peter (Schulz)

1 „Gefällt mir“

Ja, Daten von lebenden Personen gehören für mich als Ahnen- und Familienforscher dazu. Aber auch Daten zur DNA, zu genetischen Krankheiten bei den Vorfahren.

Oder im kommerziellen Umfeld Angaben zu Firmengeheimnissen, etc.

Im allgemeinen privaten Umfeld sind das für mich etwa Finanzdaten, Kontonummern, Passwörter, …

2 „Gefällt mir“

Ein Beitrag wurde in ein neues Thema verschoben: Ein Kurs am HPI

2 Beiträge wurden in ein neues Thema verschoben: Was versteht ChatGTP wirklich?

Angeregt durch einen Vortrag im Rahmen der Konferenz „Digital History 2023“ in Berlin gestern,

  • Sofia Baroncini, Marilena Daquino, Francesca Tomasi:
    Are domain-specific theoretical approaches valuable for the application of new computational methods? The case study of Erwin Panofsky’s artworks interpretations and the semantic web

habe ich ChatGPT um eine kunsthistorisch fundierte Bildbeschreibung eines Gemäldes gebeten. Ich kenne mich damit kaum aus, aber die unten stehende Antwort hat mich beeindruckt und deckt sich mit dem, was ich im Vortrag der Referentin gelernt habe. Dieses Beispiel hat keinen Bezug zur Genealogie, aber der nächste Vortrag in dieser Session drehte sich um eine KI-Anwendung in der Heraldik und hatte da dann schon eine inhaltliche Nähe zu unseren Themen.

Mein Prompt

Bitte interpretiere das Bild „Tityos“ von Michelangelo Buonarroti indem Du der Theorie von Panofsky folgst.

ChatGPT

Unter Anwendung der Panofsky-Theorie zur Kunstinterpretation können wir das Gemälde „Tityos“ von Michelangelo Buonarroti analysieren.

Auf der ikonographischen Ebene zeigt das Gemälde die mythologische Figur Tityos, der für seine Sünde bestraft wird. Der ikonographische Ansatz besteht darin, die dargestellten Symbole, Motive und Figuren zu identifizieren und ihre Bedeutung zu erforschen. In diesem Fall verkörpert Tityos die Figur des sündigen Menschen, der göttliche Strafe erleidet. Der Geier, der seine Leber frisst, repräsentiert die Strafe und die ewige Qual.

Auf der ikonologischen Ebene können wir die Beziehung zwischen den symbolischen Elementen untersuchen, um die tiefere Bedeutung und Botschaft des Gemäldes zu verstehen. In der griechischen Mythologie wird Tityos bestraft, weil er versuchte, eine Göttin zu vergewaltigen. Diese Darstellung kann als Warnung vor den Konsequenzen unmoralischen Verhaltens und göttlicher Vergeltung interpretiert werden. Das Gemälde könnte somit moralische und ethische Überlegungen hervorrufen und den Betrachter zur Reflexion anregen.

Auf der stilgeschichtlichen Ebene können wir die stilistischen Merkmale des Gemäldes analysieren. Michelangelo ist bekannt für seinen kraftvollen Stil, seine muskulösen Figuren und die Präsenz von Anatomiedetails. Das Gemälde zeigt eine meisterhafte Beherrschung der menschlichen Figur und eine eindringliche Darstellung von Emotionen. Dieser Stil spiegelt Michelangelos Fähigkeiten als Bildhauer wider und unterstreicht seine einzigartige künstlerische Vision.

Zusammenfassend lässt sich sagen, dass das Gemälde „Tityos“ von Michelangelo Buonarroti auf der ikonographischen Ebene die mythologische Geschichte darstellt, während es auf der ikonologischen Ebene moralische und ethische Überlegungen anregt. Auf der stilgeschichtlichen Ebene zeigt das Gemälde Michelangelos künstlerische Fähigkeiten und seinen individuellen Stil. Durch die Anwendung der Panofsky-Theorie können wir eine umfassende Interpretation des Gemäldes erhalten und seine Bedeutung im Kontext von Kunst, Mythologie und Ethik erfassen.

Hallo,

vielleicht interessiert Euch diese Veröffentlichung des Büros für Technikfolgenabschätzung beim Bundestag, auch wenn es nicht um GEDCOM etc. geht.

ChatGPT und andere Computermodelle zur Sprachverarbeitung – Grundlagen, Anwendungs-
potenziale und mögliche Auswirkungen

Schöne Grüße,
Renate

2 „Gefällt mir“