Todesursachen durch KI strukturieren lassen

Silvia_Diessner · 16. März 2026 um 18:45

Hallo,

ich habe kürzlich mit ChatGPT im Plus-Abo ein Experiment gestartet, was allerdings nicht ganz den erhofften Erfolg hatte. Vielleicht habe ich die falschen Fragen gestellt, aber vielleicht kann das die KI auch einfach nicht?

Das Experiment:
Eine OFB-Gedcom hat 60.000 Datensätze, davon ist bei 17.000 Personen eine Todesursache eingetragen. Die Gedcom habe ich in eine csv-Datei konvertiert und dann hochgeladen.
Ich habe der KI 30 Kategorien an möglichen Todesursachen vorgegeben und diverse Anweisungen erteilt (ordne alle Datensätze, die Nervenschlag enthalten der Kategorie Schlagfluss zu) usw. Das hat soweit sauber geklappt, wobei ich das mit Excel auch selbst schnell erledigt hätte.

Meine Hoffnung war, dass die KI bei uneindeutigen Todesursachen ein Muster erkennt und dann auch diese fehlenden 2000 Datensätze einer Kategorie zuordnet. Beispiel: Asthma ist eine Lungenerkrankung - das “weiß” die KI sicherlich grundsätzlich, wendet das hier aber nicht an. Oder anderes Beispiel: Durchbruch der Zähne wurde nach meiner Anweisung sauber dem Kindstod zugeordnet, nicht aber Ausbruch der Zähne. Ein Darmleiden ist eine Darmerkrankung. usw.

Was meinen die Profis hier? Sind solche Aufgaben mit ChatGPT grundsätzlich lösbar und ich habe nur die falschen Fragen gestellt oder sind meine Erwartungen zu hoch?

Silvia_Diessner · 16. März 2026 um 23:38

Ich habe jetzt mal die KI selbst befragt, warum so viele unzugeordnete Datensätze übrig blieben.

Antwort sinngemäß: die falschen Fragen, war ja klar.

Das ist die von ChatGPT selbst vorgeschlagene Anweisung:

Du erhältst eine Liste von Todesursachen aus alten Kirchenbüchern oder historischen Aufzeichnungen. Die Todesursachen können historische Begriffe (z. B. „Lungensucht“, „Jammer“, „Schlagfluss“) oder moderne medizinische Begriffe (z. B. „Asthma“, „Herzinfarkt“) sein. Deine Aufgabe ist es, jede Todesursache einer von 10 vorgegebenen Kategorien zuzuordnen.

Die Kategorien sind:

Lungenkrankheit

Herz-Kreislauf-Erkrankung

Infektionskrankheit

Kindstod

Krebs

Unfall / Verletzung

Alterskrankheit / natürliche Ursachen

Magen-Darm-Erkrankung

Neurologische Erkrankung

Sonstige / unbekannt

Wichtige Regeln:

Nutze dein medizinisches Wissen, um moderne Begriffe korrekt einzuordnen, auch wenn sie nicht in den historischen Beispielen vorkommen.

Historische Begriffe müssen nach ihrer wahrscheinlichen Bedeutung kategorisiert werden.

Wenn eine Todesursache unklar oder mehrdeutig ist, ordne sie der Kategorie „Sonstige / unbekannt“ zu.

Liefere die Ergebnisse in Tabellenform, z. B.:

Todesursache Kategorie

Lungensucht Lungenkrankheit

Asthma Lungenkrankheit

Schlagfluss Herz-Kreislauf-Erkrankung

Jammer Kindstod

Optional: Du kannst die KI anweisen, bei unbekannten oder seltenen historischen Begriffen kurz zu erklären, warum sie eine Kategorie gewählt hat.

Liste nun alle Todesursachen aus der bereitgestellten Datei mit der zugehörigen Kategorie auf.

Tipps für den Live-Test:

Klein anfangen: Erst nur 50–100 der kniffligen Fälle testen. So siehst du, wie zuverlässig die Zuordnung funktioniert.

Feedback-Schleife: Fehler oder Unsicherheiten direkt in den Prompt aufnehmen („Wenn unsicher, Kategorie Sonstige“) – dadurch verbessert sich die Zuordnung.

Iteratives Vorgehen: Nach jedem Testlauf die besonders schwierigen Begriffe als Beispiele ergänzen, dann den nächsten Batch laufen lassen.

Werde ich demnächst mal ausprobieren.

Hermann_Hartenthaler · 25. Mai 2026 um 08:56

Bist Du hier weitergekommen? So eine Normierung der Todesursachen wäre spannend.

Hast Du mal im Internet gesucht, ob es so eine Tabelle schon irgendwo gibt?

Ich habe gerade ein noch nicht releasetes neues webtrees Erweiterungsmodul ausprobiert, das zu einem Stammbaum eine Statistik der Todesursachen anzeigt (ohne Normierung).

Hier das Ergebnis aus meinem Stammbaum.

Man sieht, dass ich selbst schon etwas normiert habe. Aber eigentlich will ich davon weg und als Todesursache genau das erfassen, was in der Quelle steht. Die Normierung soll dann erst durch ein Erweiterungsmodul als Zusatzinformation passieren.

Silvia_Diessner · 26. Mai 2026 um 06:49

Moin Hermann,

in Webtrees erfassen wir auch immer die genaue Todesursache, so wie sie im Kirchenbuch bzw. Standesamt steht.
Diese Auswertung ist „nur“ für einen Blogartikel. Ganz einfach habe ich das schon mal vor Jahren für Genthin gemacht:

https://silviadiessner.de/2020/03/todesursachen-im-ofb-genthin/

Jetzt soll es etwas genauer und auch wissenschaftlich fundierter werden. Für dich intern (bitte nur für dich und nicht veröffentlichen) ist unser bisheriger Arbeitsstand anbei. Die Schwierigkeit besteht zunächst darin die alten Bezeichnungen den heute üblichen Todesursachen zuzuordnen. Oft wusste man damals ja selbst nicht so genau woran die Leute gestorben sind.

Grundsätzlich finde ich deine Idee aber gut, die Todesursachen in Webtrees auswerten zu können (auch wenn ich ja immer noch 1.7.18 nutze). Allerdings: wenn der Stammbaum öffentlich ist, sollte man vielleicht die Herkunft der Daten etwas erklären. Bei deiner Auswertung fällt sehr viel Krieg und alle Arten von Unfall auf. Diese Häufung ist ungewöhnlich (und somit erklärungsbedürftig).

Gibt es eigentlich auch schon eine Auswertung der Mehrlingsgeburten? Irgendwie habe ich mal am Rande mitbekommen, dass im neuen Webtrees Zwillinge extra gekennzeichnet werden können. Das wäre schon spannend. Die Mehrlingsgeburten habe ich auch mal händisch für Aken ausgewertet. Wenn man einmal die richtige Exceltabelle erstellt hat, lässt sie sich aber bequem um weitere Jahre erweitern.

https://silviadiessner.de/2026/02/zwischen-zufall-und-vererbung-zwillingsgeburten-in-aken-elbe/

Grüße
Silvia

(Anhänge)

Todeskategorien_1.docx (22.4 KB)

Hermann_Hartenthaler · 26. Mai 2026 um 09:00

Ich denke, dass diese Kategorie hier öffentlich und für Suchmaschinen erreichbar ist.

Dieser Bias liegt daran, dass solche Todesursachen sich einprägen. Viele Quellen zu diesen Todesfällen sind mündliche Überlieferung.

Das geht in jedem Programm, das das GEDCOM Kennzeichen ASSO unterstützt. Ich setze von Hand ASSO-Links zwischen allen Mehrlingen.

Todesursache	Kategorie
Lungensucht	Lungenkrankheit
Asthma	Lungenkrankheit
Schlagfluss	Herz-Kreislauf-Erkrankung
Jammer	Kindstod