GEDCOM – Das Datenaustauschformat (Genealogica 2025)

Kurzfassung

Dirk Böttcher erklärt die Grundlagen, Struktur, Probleme und Neuerungen des GEDCOM-Standards inklusive praktischer Testergebnisse und Empfehlungen zur Optimierung der Datenaustauschprozesse.

wichtige Aussagen

  • GEDCOM ist ein textbasiertes Format zur Datenübertragung zwischen Genealogieprogrammen und Online-Plattformen, unterstützt nahezu alle gängigen Anwendungen.
  • Die Struktur eines GEDCOM-Files beginnt mit einem Header (0 HEAD) und endet mit einem Trailer (0 TRLR), wobei jede Zeile eine Ebenennummer, einen Tag und einen Wert enthält.
  • Typische Probleme umfassen falsche Zeichencodierung, fehlende Bilddateien und unerkannte Erweiterungen, oft durch unzureichende Dokumentation und Kommunikation unter Entwicklern bedingt.
  • GEDCOM 7, eingeführt 2021, setzt ausschließlich UTF8 als Codierung voraus, ermöglicht eigene GDZ-Pakete und verbessert die Datenvalidierung.
  • Praktische Tests zeigen, dass die Unterstützung von GEDCOM 7 in Programmen stark variiert, was zu strukturellen Problemen und Datenverlust führen kann.
  • Ahnenblatts Ansatz zur Optimierung umfasst das Erkennen der Zeichencodierung, gezielte Reparaturroutinen und die Nachbearbeitung unerkannter Datenfelder.
  • Benutzer wird empfohlen, GEDCOM-Exporte regelmäßig zu testen, Validatoren zu nutzen und Fehler direkt an Softwareentwickler zu melden.

Sources:

Zur Verfügung gestellt von news@genealogy.net - den Machern des Blog

2 Likes

Der Vortrag ist wirklich gut! Ich bin zwar mit der Darstellung von webtrees in dem Zusammenhang nicht ganz einverstanden, aber nun gut, da bin ich parteiisch.

1 Like