Gedcom - alternative Dateiformate

Ich sehe da wie Martina einen Riesenunterschied. Bei einer CSV-Datei aus Programm A wird Programm B selten auch nur eine Person einlesen können, also letztlich nichts übernehmen, während bei Unterstrich-Kennzeichen in GEDCOMs nur eine einzelne Information fehlt.

Gemeint war hier eine Automatik, die mir z.B. eine Kekule-Nummer (durchaus intern in einem REFN-Feld) bei Anlage eines neuen Elternteils automatisch einträgt. Letztlich kein Thema des Datenaustauschs, sondern der Wunsch nach einer neuen Programmfunktionalität.

Gruß, Dirk

Ich habe deinen GenWiki-Artikel …

… einfach mal exemplarisch mit Hilfe von KI am Ende um zwei Tabellen zu Im- und Exportformaten erweitert, damit man mal einen Eindruck bekommt, wie das aussehen könnte.

Wenn es gar nicht gefällt oder grundsätzlich zu viele Unwahrheiten enthält, gerne wieder löschen.

Es sollte allerdings nicht Sinn des GenWiki-Artikels sein einfach nur KI-Abfragen zu sammeln.

Die Tabellen spiegeln schon die Vermutung wider, dass GEDCOM 5.x das geeignetste Datenaustauschformat ist (wenn es denn bei diesem Thema bleibt). Alle csv-Formate werden pauschal in einen Topf geworfen - entspricht nicht der Realität. Aus meiner Sicht daher kaum wirklich hilfreich. Zur Verbesserung sollte man noch eine Art Qualitätsprüfung einführen, damit der Artikel einen Mehrwert erhält.

Man nehme eine GEDCOM 5.x Test-Datei z.B. von hier …

… und importiere und exportiere diese wieder in den unterschiedlichsten Programmen und Formaten, die man alle dort auf der Seite hochlädt. Dazu vielleicht noch eine Art Zusammenfassung, wie Anzahl der Struktur-Fehler und Anzahl der resultierenden GEDCOM-Zeilen (manche Programme ignorieren einen Teil der Daten).

GEDCOM-Struktur-Fehler ließen sich mit diesem Tool prüfen …

Klingt vielleicht alles ganz toll … müsste nur jemand machen … :wink:

Und regelmäßig aktualisieren wäre auch nicht schlecht.

Gruß, Dirk

2 „Gefällt mir“

Stimmt. Ich habe das ja mal mit einer Testdatei gemacht: https://wiki.genealogy.net/Webtrees_Handbuch/Allgemeine_Erläuterung_des_Programms#Test_zum_Import_und_Export_von_GEDCOM-Daten

Müsste um weitere Programme erweitert werden und besser kommentiert werden.

@Dirk_Bottcher Danke für die Ergänzung des GenWiki-Artikels. Habe ihn nun wie angeregt umbenannt und einer Weiterleitung vom alten Artikel eingerichtet.

1 „Gefällt mir“

Neben dem Wiki ist auch dieser Thread etwas umfassender als die Überschrift geworden.
Ich sehe hier Diskussionen zu GEDCOM 5.5.1 als wohl noch bleibenden Grundpfeiler des Datenaustauschs und anderen (Nachfolge)-Formaten die Wünsche der Nutzer berücksichtigen durch Programmierer, Teilnehmer an Definitionsdiskussionen und fortgeschrittenen Nutzern. Ich betrachte mich als zu letzterer Gruppe angehörig und eben auch als Anwender mit Wünschen. Und diese Diskussion finde ich sehr interessant und nützlich, besonders sofern sonst letzthin nirgends aktiv betrieben.
Zur Klärung: um 2006 und nochmal um 2012 habe ich mich doch einigermaßen mit GEDCOM und dessen Speicherung von Daten beschäftigt um Limits und auch Austauschprobleme besser zu verstehen. Letzthin nicht mehr, weswegen ich einiges vergessen habe.

Bewusst hier aufgrund mangelnder Datenbank- und Status der Definition-Kenntnisse weiter ins Fettnäpfchen zu treten, versuche ich einige der aufgeworfenen Punkte besser zu definieren, um zu verstehen ob wirklich “Features” von Software ausreicht, diese abzudecken oder eben wie mein Eindruck, zum Austausch von Logiken in Daten, diese doch in eine Definition gehören (ob nun breit angewendet oder nicht bleibt fraglich). Hier also was der internationale 5.5.1 m.E. nicht abdecken kann:

  • Orte: mit Erwähnung Orts-Verwaltung meinte ich dass Software ohne eine solche nicht mal 5.5.1 komplett abdecken können, also setze ich dieses (für mich) Grundfeature voraus. GPS-Felder: sind nicht nativ und flexibel (bleiben starr). Ich kann mir nicht vorstellen, dass Logiken Sprach- und zeitliche Versionen, Custom Hierarchien / Pfarren usw. in 5.5.1 oder L-Definition austauschbar erhalten bleiben oder wäre das schon möglich? Diese Funktion als reines Feature wäre für mich nämlich nur interessant zu nutzen, wenn nicht nur von einer Software unterstützt. Ähnlich auch in nun folgenden Punkten.
  • Quellenverwaltung: bei Medienanhang meine ich besonders flexiblere Standarddefinition von Speicherorten (lokal absolut/relativ, online https/webdav) usw. und explizite Unterstützung von modernen Formaten (auch in der Darstellung) wie WebP, MD (Markdown) und gute PDF-Unterstützung. Ist klar, dass das letztendlich ein Feature der Software ist, aber die Definition der wichtigsten Formate im Standard, würde dies vielleicht etwas harmonisieren. Ebenso interessant vordefinierte Möglichkeiten die Daten (GEDCOM und die verknüpften Medien) als komprimierte Datei (ZIP) zusammen zu speichern.
  • Bezifferungsfelder: hier meinte ich dass REFN+INDI (immer) den Probanden (oder das Start-Paar) referenziert und somit unterschiedliche Bezifferungs-Sets für diverse Probanden einfacher parallel gehalten werden können und diese Logik auch bei Austausch behalten werden kann. Ich behelfe mir derzeit mit unbefreidigenden Mehrfacheinträgen in REFN oder auch CAST (Feld für Kaste); SSN (Social Security Number) “mißbrauche” ich derzeit (noch) nicht. Eine automatische Füllung der Bezifferung ins Feld ausgehend von Startperson ist sicherlich ein Feature, würde dann dazu passen. Eine dynamische Bezifferung bei Ausgaben (Tafeln, Listen) reicht mir nicht, besonders wenn man z.B. zwei Probanden vergleicht/untersucht.
  • Referenzierung von Personen bei Ereignissen und vielleicht auch dazu DNA-Genealogie Felder: Felder für at, Y, mt - Matches (Referenzierung Personen), Felder für Y, mt - Haplogruppen
    Falls nicht explizit im Standard definiert sollte es die Definition eines Schemas für Erweiterungen geben (kein Datenverlust bei unbekannten Tags), die dann von unterschiedlicher Software austauschkonform unterstützt werden könnte.
  • XML Nachteile kann ich zu wenig praktisch einschätzen, aber Vermeidung von Ambiguitäten in der Syntax (z.B. Zeilenumbrüche, UTF-8 Zwang) könnten besser funktionieren. Ich denke das wurde sicher in der GEDCOM-L ausführlich diskutiert und ist dort vielleicht geregelt. Solang aber international die schwächere 5.5.1 zählt, finde ich dies unzufriedenstellend. Hängt wie anderes natürlich immer davon ab, dass die Big Player das relativ bald und gut unterstützen.

Ich hoffe über den Jahreswechsel kann ich ein wenig den Stand der Dinge bei Import/Export bzw. Kompatibilität bei einiger aktueller Software testen.
Da einige meiner Wünsche wohl kaum irgendwo realisiert werden, möchte ich auch probieren wieweit ich mit Skripten (KI-Generiert) zur GEDCOM-Manipulierung komme, zumindest für Auszüge von Datensätzen von denen dann Ausgaben eben mit diversen REFN usw. erstellt werden sollen.
In Gramps/Python hatte ich das schon mal probiert, aber die KI’s waren damals (vor über 12 Monaten) noch zu schwach und ich habe dann aufgegeben umfassende Tests usw. zu machen.

[ChrisR]

Bewusst hier aufgrund mangelnder Datenbank- und Status der Definition-
Kenntnisse weiter ins Fettnäpfchen zu treten, versuche ich einige der
aufgeworfenen Punkte besser zu definieren
, um zu verstehen ob wirklich

Du trittst nicht ins Fettnäpfchen (IMHO), aber du wirfst bewusst oder
unbewusst verschiedene Schichten bunt durcheinander, nämlich
Programm-Funktionalität mit Austausch-Funktionalität. Ich bin auch nur
Anwender, bilde mir aber ein, ein kleines bisserl Ahnung (zumindest
Halbwissen) von Programmieren, Datenbanken und GEDCOM zu haben. Deshalb
schreibe ich das hier aus meiner subjektiven Sicht, der vielleicht nicht
jeder zustimmt. Von Anwender an Anwender.

Vorsicht: Es wird lang. Und vielleicht auch recht technisch.

Der Titel des Threads ist „Gedcom - alternative Dateiformate“. Irgendwo
ziemlich am Anfang steht die Aussage „Software-Katastrophe GEDCOM“.
GEDCOM ist KEINE Software. GEDCOM ist ein Transport- oder
Austausch-Format. Als Alternativen fallen mir dazu nur 2 weitere Formate
ein: XML, JSON

Dass von einigen Programmierern XML oder JSON bevorzugt wird, mag
vielleicht daran liegen, dass einige Programmiersprachen nativen Support
für XML oder JSON bieten, während die Programmierer für GEDCOM erst
einen eigenen Parser schreiben müssen, wenn’s noch kein anderer getan hat.

Da es nach Thread-Titel eigentlich um den Austausch gehen soll, versuche
ich mal die Programm-Funktionalität von der Austausch-Funktionalität in
deinen Punkten zu trennen. (In der Programmierung gibt es das
MVC-Konzept (Model-View-Controller), das die verschiedenen Schichten
voneinander unabhängig hält. Auch für Genealogie-Software und den
Datenaustausch sollte man das anwenden können.)

Vorsicht: vielleicht zerhagelt Discourse wieder meine Formatierungen :frowning:
Unterstriche scheint Discourse als Umschalter zu Kursiv zu verstehen.

  • Orte: mit Erwähnung Orts-Verwaltung meinte ich dass Software ohne
    eine solche nicht mal 5.5.1 komplett abdecken können, also setze ich
    dieses (für mich) Grundfeature voraus. GPS-Felder: sind nicht
    nativ und flexibel (bleiben starr). Ich kann mir nicht vorstellen,
    dass Logiken Sprach- und zeitliche Versionen, Custom Hierarchien /
    Pfarren
    usw. in 5.5.1 oder L-Definition austauschbar erhalten
    bleiben oder wäre das schon möglich? Diese Funktion als reines
    Feature wäre für mich nämlich nur interessant zu nutzen, wenn nicht
    nur von einer Software unterstützt. Ähnlich auch in nun folgenden
    Punkten.

Orts-Verwaltung:
ist Programm-Funktionalität. Was ein Programm hier anbietet, ist
abhängig davon, für was es gedacht ist, und davon was der Programmautor
seinen Anwendern an Komfort bietet. Hier gibt es alles von einem
einfachen Eingabefeld bis zu einer umfangreichen Ortsdatenbank.

Transport-Funktionalität: da gibt das Standard-Kennzeichen PLAC,
außerdem die GEDCOM-L-Erweiterung „_LOC“. Damit kann man bereits
Orts-Hierarchien abbilden. Und Ortsstrukturen sind gerade beim
GEDCOM-Steering-Kommittee in Überarbeitung.

  • Quellenverwaltung: bei Medienanhang meine ich besonders flexiblere
    Standarddefinition von Speicherorten (lokal absolut/relativ, online
    https/webdav) usw. und explizite Unterstützung von modernen Formaten
    (auch in der Darstellung) wie WebP, MD (Markdown) und gute PDF-
    Unterstützung. Ist klar, dass das letztendlich ein Feature der
    Software ist, aber die Definition der wichtigsten Formate im
    Standard, würde dies vielleicht etwas harmonisieren. Ebenso
    interessant vordefinierte Möglichkeiten die Daten (GEDCOM und die
    verknüpften Medien) als komprimierte Datei (ZIP) zusammen zu speichern
    .

Quellen-Verwaltung:
ist Programm-Funktionalität. Manche bieten nur ein einfaches
Eingabe-Feld, in das man alles reinquetschen muss, was man braucht um
eine Quelle wiederzufinden. Und dann muss man vielleicht kryptisch
abkürzen, weil das Feld nicht lang genug ist. Für den Transkript-Text
ist kein Platz. Andere ermöglichen die Eingabe von Quellzitaten und
Dokument-Anhänge. Einige zeigen die Dokumente auch an, bei anderen muss
man das Dokument separat öffenen. Welche Art Dokumente man anhängen kann
bzw. wie sie angezeigt werden, bestimmt das Programm (der
Programm-Autor). Markdown (z.B. in Quell-Zitaten) ist auch nur eine
Anzeige-Form = Programm-Funktionalität.
Was du unter „gute PDF-Unterstützung“ verstehst, ist mir nicht klar.
Aber egal ob es um Dokument-Anhang, -Anzeige, oder -Erstellung geht, das
ist alles Programm-Funktionaliät.

Transport-Funktionalität: GEDCOM bietet für Quellen SOUR mit diversen
Unterkennzeichen wie PAGE, AUTh, … . Medien können einem SOUR
zugeordnet werden.
Für Medien hat GEDCOM die gängigsten Formate (jpg, pdf, mp3, mp4, …)
in Petto. webp ist neuer und nicht im Standard gelistet, es sollte aber
trotzdem kein Problem sein, das zu transportieren.
Mit GEDCOM 7 gibt es auch die zip-Möglichkeit.

  • Bezifferungsfelder: hier meinte ich dass REFN+INDI (immer) den
    Probanden (oder das Start-Paar) referenziert und somit
    unterschiedliche Bezifferungs-Sets für diverse Probanden einfacher
    parallel gehalten werden können und diese Logik auch bei Austausch
    behalten werden kann
    . Ich behelfe mir derzeit mit unbefreidigenden
    Mehrfacheinträgen in REFN oder auch CAST (Feld für Kaste); SSN
    (Social Security Number) “mißbrauche” ich derzeit (noch) nicht. Eine
    automatische Füllung der Bezifferung ins Feld ausgehend von
    Startperson ist sicherlich ein Feature, würde dann dazu passen. Eine
    dynamische Bezifferung bei Ausgaben (Tafeln, Listen) reicht mir
    nicht, besonders wenn man z.B. zwei Probanden vergleicht/untersucht.

Bezifferungs-Felder:
ist Programm-Funktionalität: Kekule/SOSA etc. sind Probanden-abhängig.
Da sollte das Programm in der Lage sein, den Probanden zu wechseln und
die Bezifferungen anzuzeigen. Auch ob das Programm ein Bezifferungsfeld
anbietet, damit der Forscher dort eine „Familien-Signatur nach eigenem
System“ eintragen kann, bestimmt der Programm-Autor.

Transport-Funktionalität:
Bezifferungen wie Kekule/SOSA haben IMHO(!) nichts im im
Austausch-Format zu suchen. Warum sollte ich diese statisch für mich,
meine Kinder, Eltern, Großeltern, Patenkinder, Großonkel und wen auch
immer transportieren und die Export-Datei aufblähen? Für eigene
Signaturen, wer’s braucht, steht REFN zur Verfügung.

  • Referenzierung von Personen bei Ereignissen und vielleicht auch

Referenzierungen:
ist Programm-Funktionalität: ob ich einen Paten oder Trauzeugen nur
textlich eintragen kann, oder ob ich eine Person aus dem Datenbestand
zuweisen kann, bestimmt der Programm-Autor. Ob man auch allgemein
Beziehungen wie Nachbar/Arbeitskollege/Vereinskamerad zuweisen kann, ist
abhängig vom Programm (Funktionalität).

Transport-Funktionalität:
In GEDCOM 5.5.1 geht das mit _ASSO (GEDCOM-L?), in V7 gibt es ASSO.

dazu *DNA-Genealogie Felder*: Felder für at, Y, mt - Matches
(Referenzierung Personen), Felder für Y, mt - Haplogruppen
Falls nicht explizit im Standard definiert sollte es die *Definition
eines Schemas für Erweiterungen* geben (kein Datenverlust bei
unbekannten Tags), die dann von unterschiedlicher Software
austauschkonform unterstützt werden könnte.

DNA-Genealogie:
Programm-Funtkionalität: DNA-Genealogie ist relativ „jung“. Da müssen
Programmautoren erstmal schauen, wie sie was im Programm unterstützen
wollen/können.

Transport-Funktionalität:
explizite Kennzeichen gibt es nicht, siehe „jung“. Ließe sich aber mit
Sicherheit über Unterstrich-Kennzeichen transportieren.

  • XML Nachteile kann ich zu wenig praktisch einschätzen, aber
    Vermeidung von Ambiguitäten in der Syntax (z.B. Zeilenumbrüche,
    UTF-8 Zwang) könnten besser funktionieren. Ich denke das wurde

Grundsätzlich könnte man alles, was es im GEDCOM gibt, auch über xml
oder json abbilden. Aber dazu muss man sich auch erstmal auf eine
gemeinsame Nomenklatur und Grammatik einigen. Und warum sollte das
besser gehen als beim GEDCOM-Format?

GEDCOM (5.5.1) hat sicher einige Mankos. Aber es ist ein verdammich
mächtiges Austauschformat. Die oben genannte „Software-Katastrophe“
besteht meines Erachtens darin, dass die Programm-Autoren in der
Vergangenheit den GEDCOM-Standard falsch und lediglich nach ihrem Gusto
interpretiert und implementiert haben. Und darin, dass Funktionalität-
und Transport-Schicht nicht getrennt wurden. Und daraus folgt leider,
dass es an den Anwendern hängen bleibt, ihre GEDCOM-Exporte so
aufzubereiten, dass sie ihre Daten von A nach B bekommen.
Aber es wird ja am GEDCOM-Standard gearbeitet, auch wenn es gefühlt nur
in Trippelschritten vorangeht.
(Ich sollte vielleicht nicht vergessen zu erwähnen, dass der ein oder
andere Programmautor hier durchaus recht progressiv ist. Und ich will
auch nicht alle Programme über einen Kamm scheren. :wink:)

Ich hoffe über den Jahreswechsel kann ich ein wenig den Stand der Dinge
bei Import/Export bzw. Kompatibilität bei einiger aktueller Software testen.

Ich hoffe, ich konnte dir ein paar Anregungen für die
Betrachtung/Beschäftigung über den Jahreswechsel geben. :slight_smile:

Viele Grüße
Martina (Klein)

4 „Gefällt mir“

Vielen Dank für das ausführliche Eingehen auf meine Punkte. Vielleicht kommen wir dem Grund dafür auf die Spur:

Vielleicht rührt dies daher, dass ich “GEDCOM-Kompatibilität” (und andere?) vielleicht “strikt” interpretiere. Ich habe mir LLM-recherchieren lassen (nicht überprüft) wie dies von Anbietern beschrieben wird:

MyHeritage„Keep ‚Type‘ as ‚GEDCOM 5.5.1‘ and click ‚Export GEDCOM file‘.“
Ancestry is fully Gedcom compatible with Gedcom versions 5.5, 5.5.1.“
webtrees exports GEDCOM files following GEDCOM Standard 5.5.1.“ + „This is conform to the GEDCOM-L Addendum and will be part of the GEDCOM 7.0 standard.“
Ahnenblatt exports GEDCOM files following GEDCOM Standard 5.5.1.“ + „GEDCOM-Erweiterungen… wenn dieses mit anderen deutschsprachigen Programmierern… vereinbart wurde (Stichwort ‚GEDCOM-L‘).“
Ages! „Highly compatible through direct usage of GEDCOM files“
Gramps „The 5.5.1 version remains the most widely compatible data exchange format.“ + „GEDCOM 7 support… experimental.“
Heredis exports in GEDCOM 5.5.1 format.“ + „Starting with the 2023 version… GEDCOM 7 files can be imported.“
Family Historian supports GEDCOM 7: the latest version of the global standard… also supports GEDCOM Standard Release 5.5.1.“
RootsMagic „RM9 still exports only 5.5.1“ + „RootsMagic 9… imports GEDCOM 7.0 files okay.“
„Legacy Family Tree passes the GEDCOM 5.5.1 Test.“ +
Export „Produce file for: GEDCOM 5.5.1 Only.“

Um zu “strikter” Kompatibilität zurück zu kommen: ich vergleiche hier vielleicht zu den HTML und CSS Standards (Webseiten und deren Layout), da ich diese in deren Entwicklung seit über 20 Jahren verfolgt habe. Dort gab/gibt es laufend Vergleiche welche Standard/Features bzw. Version die Browser unterstützten. Keiner der Engines (Derzeit nur mehr Chrome und Firefox relevant) konnte sich leisten hier über längere Dauer neue HTML & CSS Versionen nicht zu unterstützen.
Also um zum Punkt zu kommen, besser als “unterstützt GEDCOM 5.5.1” wäre der Zusatz (außer A, B, C, etc.) wenn eben nicht 100%.

Ähnlich sehe ich dies bei Quellen-Verwaltung, Referenzierung von Personen:
Gewisse sinnvolle Logiken und Datenfelder (Hierarchien, zeitliche Varianten, Liste hinterlegte Personen, Archiv, Archivreferenz/Signatur, Titel, Querverweis Quelle, Transkription, u.a.) sehe ich eigentlich schon seit den 2000ern als essentiell für eine wissenschaftliche Arbeitsweise und möglichst flexible Publikation. Wenn nun auch neuere bzw. Standards in Definition dies nicht vereinheitlichen, stellt sich die große Frage wie viel Wert jahrzehntelange Ansammlung von Forschungs-Daten hat, wenn die Software mit den Features nicht mehr weiterentwickelt wird und es keine oder nur ein bis zwei andere Programme gibt, die abgespeicherte Logiken (teils) im Import unterstützten.
N.B.: ich hoffe es vermieden zu haben, nur von einer Software unterstütze Datenlogiken (oder eben Features) einzugeben, aber einige davon sind bei weitem nicht breit unterstützt.
Online-Anbieter mit deren oft Genealogiedaten verheerend schlechter Qualität (keine Quellen, keine Orte, Personen/Familien über weit entfernte Regionen falsch verschmolzen, kommen mir da schmerzlich in Erinnerung.
Bei Bezifferungs-Feldern gebe ich zu, ist dies anstatt den Software-Anbietern, wohl mehr den Genealogen anzulasten und derem zu schwachem Willen besonders bei Nachfahren und Verwandten “Industriestandards” zu etablieren, die dann auch einfacher als Features implementiert werden könnten.
Also ich kann mich mit dem Status Quo abfinden und arrangieren oder eben zumindest etwas “meckern” und den Frust loswerden, dass sich in meiner zukünftigen Forschungszeit hier wohl nicht viel bewegen wird.
Ich hatte vielleicht noch ein paar Gedankenpunkte, die mir jetzt nicht einfallen; vielleicht finde ich über die nächsten Wochen nochmal Zeit, mich dem Thema zu widmen.

Frohe Feiertage und gutes Forschen!

Das ist doch der Kern des Problems: alle Programme unterstützen 5.5.1 irgendwie, aber nur ganz wenige vollständig. Und dieser Standard war an so vielen Stellen missverständlich oder uneindeutig, dass selbst Programme mit einer 100%igen Unterstützung inkompatibel wären. Das ist bei 7.0 deutlich besser geworden. Bei 7.0 bedeutet “kompatibel” eigentlich 100% kompatibel, aber man sieht beispielsweise bei Heredis, dass die Marketing-Leute das wohl anders interpretieren.

Die grundlegende Datenlogik wird schon vom GEDCOM-Standard nahegelegt und sollte zu austauschbaren Daten führen, auch wenn die Programme die Datenerfassung und -präsentation verschieden gestalten. Aber die Datenqualität selbst wird vom Nutzer bestimmt. Garbage in - garbage out. Das liegt aber schon auch am Standard, denn der ist Ergebnisorientiert und eben nicht Evidenzorientiert. Aber zu letzterem ist die Luft extrem dünn geworden (kein Standard und fast? keine Programme).

1 „Gefällt mir“

Hallo Hermann,

Ich halte deine Aussagen zu GEDCOM7 für falsch. GEDCOM7 und “100% kompatibel” in einem Satz lässt den Eindruck entstehen, dass eine Umstellung aller Programme auf GEDCOM7 den Datenaustausch zwischen Genealogie-Programmen 100%ig perfekt machen würde. Das ist definitiv nicht der Fall, wie ich in einem Vortrag (nach eingehenden Tests) dargelegt habe:

Der GEDCOM7 Standard kann immer noch fehlerhaft interpretiert und falsch umgesetzt werden. Diverse Erweiterungen betreffen Funktionen, die es in vielen Programmen nicht gibt. Warum sollte hier also etwas “deutlich besser geworden” sein?

Noch unterstützen zu wenig Programme GEDCOM7 als dass hier bislang Probleme aufgetreten bzw. bekannt sind. Und wenn, kann man immer noch den GEDCOM 5.5.1 Standard verwenden.

Man hat mit GEDCOM7 einiges geändert, so dass eine GEDCOM7-Datei nicht GEDCOM 5.5.1 kompatibel ist und umgekehrt, ohne dem ganzen eine neue Dateiendung zu verpassen (z.B. .ged7 oder .gd7).

Aus meiner Sicht problematisch sind dadurch zwei Punkte:

  1. Während unbedarfte Anwender bislang nur die Existenz eines GEDCOM-Ex- und -Import kennen mussten, so ist nun auch die Versionsnummer von elementarer Bedeutung, um möglichst viel der eigenen Daten in einem anderen Programm wiederzufinden.
  2. Ältere Programme, die nie auf GEDCOM7 angepasst wurden, öffnen eine GEDCOM7-Datei als wäre es eine GEDCOM 5.5.1 Datei und können Teile der Daten nicht erkennen. Es kommt zu Datenverlusten z.B. in Datumsangaben oder Notizen.

Dass GEDCOM7 besser sein muss, weil allein schon die Versionsnummer größer ist, wäre aus meiner Sicht ein Trugschluss. Aber vielleicht kannst du noch mal argumentieren, warum GEDCOM7 nicht mehr missverständlich und jetzt eindeutiger und somit deutlich besser ist.

Gruß, Dirk

1 „Gefällt mir“

Hallo Dirk,

vielen Dank für die Bereitstellung deines Vortrags von der Genealogica 2025. Er erklärt das GEDCOM‑Datenaustauschformat ausgesprochen gut, und ich kann deine Schlussfolgerungen voll und ganz bestätigen. In der Praxis zeigt sich leider immer wieder, dass Programme zwar mit GEDCOM‑Kompatibilität werben, diese aber nur teilweise oder sogar fehlerhaft umsetzen.

Gerade im GEDCOM‑Umfeld gilt für mich ganz klar: Ein Format ist erst dann ein echter Standard, wenn es auch zuverlässig validiert werden kann. Ohne eine solche Validierung entstehen zwangsläufig Interpretationsspielräume und am Ende ein regelrechter Wildwuchs. Genau hier sehe ich FamilySearch bzw. das GEDCOM Steering Committee in der Verantwortung.

Früher – zu Zeiten von GEDCOM 5.5 – gab es immerhin so etwas wie ein Gütesiegel von FamilySearch. Programmautoren konnten ihre Software dort registrieren lassen; das Produkt wurde offiziell als „GEDCOM 5.5‑kompatibel“ geführt, eine Beispieldatei wurde gegen den Standard geprüft und der Autor erhielt Rückmeldungen zu Abweichungen. Dieses Verfahren hat für Klarheit gesorgt.

Heute fehlt ein solcher Mechanismus leider komplett.

Viele Grüße, Peter

1 „Gefällt mir“

Das war missverständlich. Du hast völlig recht, dass 100% GEDCOM 7 kompatibel für einen problemlosen Austausch nicht hinreichend ist. Meine Aussage war so gemeint: die GEDCOM-Standardisierer erwarten, dass wenn ein Programm behauptet, es sei GEDCOM 7 konform, dass dann das Programm mit allen Sprachelementen ohne Fehler zurechtkommt.

Aus meiner Sicht sind etliche unklare Formulierungen in 5.5.1 nun in 7.0 klarer beschrieben. Da sind ja auch etliche Hinweise aus der GEDCOM-L-Gruppe eingeflossen.

Das will ich gerne tun, aber dazu muss ich ein wenig mehr Zeit haben, wenn es Hand und Fuß haben soll. Spontan fällt mir ein, dass in GEDCOM 7 geklärt ist wie Mediendateien zu transportieren sind.

Hallo Hermann,

Ok, hätte ich jetzt nicht so gesehen.
Die GEDCOM-Doku ist weiterhin ein mehr als 100-seitiges englischsprachiges Dokument. Mögen die Formulierungen darin besser sein - entscheidend ist, was Programmentwickler daraus machen …

Nein, du musst da nicht näher drauf eingehen, wenn es aufwändiger wird.

Du meinst wahrscheinlich das optionale gdz-Format, das in einer einzigen Datei Daten und Mediendateien enthält.

Gravierender finde ich, dass FILE-Angaben jetzt nach RFC 8089 codiert werden müssen - also nicht einfach nur Ordner + Dateiname im Windows-Stil reinkopieren.

Gruß, Dirk

Hallo Peter,

Wenn ich mich recht entsinne, gab es das nicht lange. Verschwand Anfang der frühen 2000er mit der Website www.gedcom.org.

Wäre cool, wenn man etwas ähnliches unter der Schirmherrschaft von CompGen wieder auf die Beine stellen könnte. Ich wäre dabei …

Gruß, Dirk

1 „Gefällt mir“

@AEmmerich Gibt es bei der GEDCOM -Arbeitsgruppe Überlegungung zu einem Gütesiegel oder einem Zertifikat? Könnten wir das auf die Beine stellen?

1 „Gefällt mir“

Hallo Hermann,

meinst du mit der GEDCOM‑Arbeitsgruppe die GEDCOM‑L‑Gruppe oder das GEDCOM Steering Committee?

Aus meiner Sicht wäre die GEDCOM‑L der falsche Adressat, da sich dort im Wesentlichen die Programmautoren selbst bewerten würden. Für ein Zertifikat oder Gütesiegel braucht es jedoch eine neutrale Instanz, um Glaubwürdigkeit und Unabhängigkeit sicherzustellen.

Neben dem GEDCOM Steering Committee käme dafür aus meiner Sicht auch der Verein für Computergenealogie (CompGen) infrage. Ein solches Gütesiegel würde gut zu den Vereinszielen passen und könnte entweder von der Gruppe vergeben werden, die für die CG die Softwaretests durchführt, oder von der Gruppe, die das GenWiki‑Portal „Software“ betreut.

Was genau ein solches Gütesiegel abdecken soll, müsste noch ausgearbeitet werden. Der GEDCOM‑Datenaustausch wäre nur ein Aspekt. Weitere Kriterien könnten z. B. das Erscheinungsbild, die Dateneingabe, Auswertungen, Funktionen und Werkzeuge, der Support und ähnliche Bereiche sein.

Viele Grüße, Peter

1 „Gefällt mir“

Letztere.

Ja, ich meinte mit “wir” den Verein.

Die Testkriterien müssten aber eindeutig bewertbar sein und es müsste ein Mindestwert erreicht werden, damit das Zertifikat zugeteilt wird (etwa die Anzahl der Auffälligkeiten, die Dirk in seinem schönen Video-Vortrag anspricht).

Wenn dabei jeweils auch noch ein Testbericht für die COMPUTERGENEALOGIE abfällt, wäre das natürlich toll.

Hallo,

auch auf die Gefahr, dass ich das zu einfach sehe:

ich habe mir dazu auch Dirk Böttcher’s Video angesehen, speziell den Teil zur Gedcom-Validierung.
Ich verstehe nicht, wozu man einen “Gedcom-Validierer” braucht, um festzustellen, ob eine Software Gedcom-Daten korrekt verarbeitet oder nicht. Nach meinem Verständnis kann man das doch ganz einfach durch einen Vergleich von importiertem File mit exportiertem File sichtbar machen (WinMerge, Meld,…) ob bzw. wie die Daten importiert wurden:

maximal70_import.ged —(import)—> Software —(export)—> maximal70_export.ged
Vergleich: WinMerge(maximal70_import.ged, maximal70_export.ged)

Wenn die Software behauptet, Gedcom-kompatibel zu sein, müsste WinMerge anzeigen, dass
maximal70_import.ged und maximal70_export.ged binär identisch sind! Ansonsten müsste man sagen, dass die Software NICHT gedcom-kompatibel ist, fertig. Im letzteren Fall könnte der Anwender aber immer noch selbst entscheiden, ob ihn die Unterschiede überhaupt interessieren oder nicht, wenn z.B. Taufen o.ä. nicht importiert werden und der Anwender auch gar keine Taufen erfasst, wäre es ihm wohl egal. Ein “Gütesiegel” sollte bedeuten, dass die Software Gedcom zu 100% unterstützt, aber nicht etwa 30 oder 80%! Was sollte ein Anwender mit einem solchen Gütesiegel anfangen können?
Also: einfach importieren und exportieren, und WinMerge nach den Unterschieden fragen.

Gruß, Rainer

So ist es leider. Man kann das schon machen, aber perfekt ist so ein Vergleich nicht. Ich habe es so gemacht und einige Programme verglichen (siehe https://wiki.genealogy.net/Webtrees_Handbuch/Allgemeine_Erläuterung_des_Programms#Test_zum_Import_und_Export_von_GEDCOM-Daten).

GEDCOM lässt es zu, dass alle Datensätze neu nummeriert werden (neue XREF). GEDCOM lässt es zu, dass Datensätze in einer anderen Sortierung wieder ausgegeben werden, da die Reihenfolge etwa von Personendatensätzen keine Bedeutung hat. Aber man kann etwa in notepad++ so ein DIFF-Plugin nutzen, sodass man schon sehen kann was ggf. verloren gegangen ist. Aber binär identisch sind Import- und Export-Datei nie.

Und der zweite Punkt ist, dass ein solcher Import-/Export-Vergleich nicht reicht. Es kommt auch darauf an, dass die Informationen aus der Import-Datei auf der Bedienoberfläche eines Programms gefunden und bearbeitet werden können. Sonst wäre ja ein Programm, das den Import gleich wieder rausschreibt und gar keine Bedienoberfläche hat, ein perfektes Genealogieprogramm.

Im Video von Dirk kommt z.B. Stammbaumdrucker vor: der Export einer GEDCOM-7-Datei ist in der Qualität laut Validator sehr gut, aber die exportierte Datei ist viel kleiner als die Import-Datei. Das liegt daran, dass Stammbaumdrucker z.B. keine Quelleninformationen darstellt, das gehört einfach nicht zum nötigen Programmumfang, d.h. das Programm verwirft alle unnötigen Informationen. Völlig ok im Rahmen des definierten Funktionsspektrums des Programms. Ein Testbericht müsste aber darauf hinweisen.