Einsatz von KI bei FamilySearch

Originally published at: Einsatz von KI bei FamilySearch • Verein für Computergenealogie e.V. (CompGen)

Der Vortrag von Torsten Kux, Area Manager Europe von FamilySearch International, am 3. Juli 2025 im Zoom-Meeting des Ahnenforscherstammtischs Unna über den Einsatz von Künstlicher Intelligenz (KI) bei FamilySearch fand großen Zuspruch. Da nicht alle den Vortrag verfolgen konnten, wollen wir hier auf das sehenswerte und gerade veröffentlichte YouTube-Video verweisen, das der Organisator Georg Palmüller auf der Webseite des Ahnenforscherstammtisches verlinkt hat. Neben der Aufzeichnung gibt es noch ein umfangreiches Info-Padlet mit vielen Links zum Thema dieses Vortragsabends.

Vorstellung von FamilySearch

Nachdem sich der Referent kurz selbst vorgestellt hatte, zeigte er ein Video, in dem FamilySearch mit seinen kostenfrei zugänglichen familiengeschichtlichen Quellen präsentiert wird. Die Fakten zu dieser 130 Jahre alten Organisation, unterhalten von der Kirche Jesu Christi der Heiligen der letzten Tage in Salt Lake City, USA, lassen staunen, was den Umfang der Daten und Aktivitäten angeht: 75 Millionen Nutzer haben weltweit Zugriff auf fast 17 Milliarden Einträge, die aus 11.000 Digitalisierungsprojekten weltweit extrahiert wurden. Die 2,4 Millionen digitalisierten Mikrofilme und neue Digitalisierungsprojekte machen eine Datenmenge von 27 PB (Petabytes; 1 PB = 1.000 Terabytes) aus, und jeden Tag kommen 5 Terabytes hinzu. Die Langzeitspeicherung und -sicherung ist eine große technische Herausforderung.

Erst wenn die zirka 5,5 Milliarden Bilder durchsuchbar gemacht worden sind, können die darin verzeichneten Personen in der Familienstammbaum-Datenbank genutzt werden. Bisher sind dort 1,7 Milliarden Personen enthalten. Damit sind aber bisher erst etwa 20 % der Bilder indexiert. Weitere 30 % sind indexierbar; bei den restlichen 50 % der Bilder ist es schwierig, die Daten z.B. aus Fließtexten zu extrahieren.

KI wird die Welt der Genealogie verändern

FamilySearch setzt schon seit einigen Jahren maschinenlernende Programme ein, um handschriftliche Texte lesbar zu machen, zu segmentieren und die Inhalte zu interpretieren. Die Bilder werden in Abschnitte und Zeilen eingeteilt und der Text erkannt und gelesen. In der weiteren Verarbeitung werden aus den Textinhalten Namen, Orte oder Datumsangaben identifiziert. Daraus wird ein Index erzeugt, der für die Suche zur Verfügung steht. Die weitere Entwicklung der Software in den letzten Jahren fasst diese einzelnen Prozessschritte in einen „Transformer“ zusammen, der ähnlich wie ChatGPT funktioniert. Bei Karteikarten oder logisch aufgebauten Tabellen kann die Software erkennen, in welchem Feld welche Daten stehen.

Die Volltextsuche mit KI in den digitalisierten Bildern, die auch hier im CompGen-Blog mit Anwendungsbeispielen beschrieben wurde, ist ein weiteres Hilfsmittel, das riesige bisher unerschlossene Datenmengen auswertbar macht. Die Qualität von Stammbäumen kann durch KI mit einem Forschungsassistent verbessert werden, indem dieser Vorschläge zur Ergänzung des eigenen Stammbaums macht. Ein Chat-Tool unterstützt durch Antworten auf Nutzerfragen die Navigation auf der FamilySearch-Plattform.

Auch die KI-unterstützte Erstellung von FamilySearch-Nutzer-Stammbäumen ist hier im Blog bereits mit Praxisbeispielen behandelt worden. Im Gegensatz zum bisherigen Familienstammbaum werden dabei in einem geschützten Raum – reserviert für einzelne Bearbeiter und Gruppen – Daten zum Stammbaum bearbeitet. Diese neuen Tools sind auf der Webseite FamilySearch.org/labs zu finden. Dort werden weitere noch in Entwicklung befindlichen Tools vorgestellt, meist noch in englischer Sprache.

Wer wissen möchte, wie die genealogische Datenerschließung und -verknüpfung bei Einsatz Künstlicher Intelligenz erfolgen kann, sollte sich die Aufzeichnung und das Info-Padlet anschauen.

1 „Gefällt mir“

Es wird vor allem zu einem weiteren „Deskilling“ (Verlust von Fähigkeiten) kommen, bspw. bei der inhaltlichen Einordnung von Angaben in historischen Dokumenten. Dazu braucht es eines historischen Kontextwissens, das entweder auf eigene Erfahrung (ein Neunzigjähriger konnte mir neulich hervorragend mit Verwaltungsabläufen im West-Berlin der 1960er Jahre helfen oder mit Details zur Campagne, der Zuckerrübenernte) oder - altmodisch oder nicht - umfassende Beschäftigung mit einem Thema herrührt.

Auch wenn die kommerziellen Genealogie-Anbieter bemüht sind, jede Form von Algorithmus, OCR, anderer Mustererkennung oder Kolorierung als „KI“ zu bewerben, stößt man als praktischer Genealoge schnell an die Grenzen der Sprachmodelle (i.d.R. geht es beim Hype um diese). Viele Fragen zu historischen Sachverhalten, Bildinterpretationen etc. beantworten eben auch die besten Modelle in Ermangelung von Weltwissen mit einem Schwall aus ungefährem Blabla. Das kommt leider zu einer kritischen Zeit, weil viel Expertise - nicht zuletzt in den historischen Hilfswissenschaften und anderen Bereichen - aus demographischen Gründen weggefallen ist und als Korrektiv nicht mehr zur Verfügung steht. Dieses Korrektiv ist aber wichtig, wenn man bei gleichzeitigem Wegfall von Büchern und menschlicher Expertise eben nicht eine plausible/wohlfeile/selbstbewusste sondern eine richtige Antwort möchte.

1 „Gefällt mir“