GEDBAS Jahresrückblick 2024

Originally published at: GEDBAS Jahresrückblick 2024 • Verein für Computergenealogie e.V. (CompGen)

Vor fünf Jahren habe ich den GEDBAS-Jahresrückblick 2019 geschrieben. Eigentlich wollte ich das jedes Jahr machen, das ist aber offenbar in Vergessenheit geraten. Dieses Jahr hat mich zum Glück jemand daran erinnert, so dass es nun den GEDBAS-Jahresrückblick 2024 gibt.

In den vergangenen fünf Jahren ist GEDBAS, unsere Genealogische Datenbank, kräftig gewachsen; statt 20 Millionen sind mittlerweile 30 Millionen Personen verzeichnet.

Häufigste Genealogieprogramme

Hier ist die Liste, mit welchen Programmen die 2024 hochgeladenen GEDCOM-Dateien erstellt wurden:

Wie bereits in den letzten Jahren belegt Anhnenblatt den Spitzenplatz, mit weitem Vorsprung vor dem zweiten Platz, dem Export aus ancestry.com. Angegeben sind die Veränderungen gegenüber dem Jahresrückblick 2019. Großer Aufsteiger ist Heredis, das vor fünf Jahren noch unter „ferner liefen“ aufgeführt war. PAF, der Dinosaurier unter den Genealogieprogrammen ist immer noch im Rennen, mittlerweile 11 Jahre nach Ende der Entwicklung. Anzumerken sei auch dieses Jahr wieder, dass diese Rangliste nur die Anzahl der bei GEDBAS hochgeladenen Dateien berücksichtigen kann. Möglicherweise sind also die Ahnenblatt-Nutzer nur besonders fleißig beim Veröffentlichen ihrer Ergebnisse.

GEDCOM-Versionen

Vor fünf Jahren konnte ich die frisch zum Standard erklärte Version 5.5.1 erwähnen. Mittlerweile gibt es seit dem Jahr 2021 Version 7.0.3 (Version 6 wurde übersprungen). Man sieht deutlich, wie die alte Version 5.5 durch die neuere 5.5.1 verdrängt wird:

Der Trend zur Ablösung von Version 5.5. scheint zum Erliegen gekommen zu sein. Schuld daran dürfte die noch recht hohe Verbreitung von PAF zu sein, das nur GEDCOM-Dateien in der alten Version exportieren kann. Die neue GEDCOM-Version 7.0.3 spielt praktisch noch keine Rolle.

Überraschend ist dieses Jahr wieder eine GEDCOM-Datei mit (der schon im Januar 1996 abgelösten) Version 5.3 aufgetaucht. Zunächst hatte ich vermutet, dass es sich um einen Test handelt. Aber nein, das sind echte Daten. Die Datei wurde übrigens mit Familienstammbaum für Windows 1.0 erzeugt. Das Programm ist etwa 30 Jahre alt – verrückt!

Zeichenkodierung

Eine andere Zeichenkodierung als UTF-8 zu verwenden, ist eigentlich nicht sinnvoll. Folgerichtig erlaubt GEDCOM 7 auch nur noch UTF-8 kodierte Dateien. Die Ablösung älterer Varianten ist im Diagramm gut zu erkennen. Auch hier ist wieder durch die Verwendung alter Programme eine Sättigung zu erkennen.

Dateigrößen

Ich hatte es fast nicht für möglich gehalten, aber das Wachstum der GEDCOM-Dateien geht unvermindert weiter.

Die 75%-Linie hat mittlerweile fast die 4 MB erreicht. Das heißt, ein Viertel der bei GEDBAS hochgeladenen GEDCOM-Dateien ist mehr als 4 MB groß. Der Mittelwert liegt durch einige enorm große GEDCOM-Dateien bei über 6 MB. Vor fünf Jahren habe ich über »Gigantomanie« bei GEDCOM-Dateien gesprochen, die 160 MB groß sind. Im Vergleich zu dem, was da noch kam, waren das noch Winzlinge:

Die beiden derzeit mit Abstand am größten Dateien sind 339 MB und 323 MB groß. Beide stammen von ancestry.com. Wir reden hier über Bestände mit mehreren hunderttausend Personen – so viele kann doch niemand wirklich erforscht haben.

Quellenangaben

Gibt es neben dieser „Jäger und Sammler“-Mentalität von „immer mehr“ auch Fortschritte bei seriöser Forschung mit Quellenangaben? Dazu habe ich mir angesehen, wie viele Personen mindestens eine Quellenangabe haben.

Langfristig zeigt die Kurve in die richtige Richtung. In den letzten Jahren ist allerdings wieder ein beunruhigender Abwärtstrend zu sehen. Derzeit sind nur etwa ein Drittel der hochgeladenen Personen mit Quellenangaben versehen. Es ist also noch einige Aufklärungsarbeit zu leisten, damit langfristig der Anteil der Daten mit Quellenangabe steigt.

9 „Gefällt mir“

Ich finde das sehr interessant, danke dafür. Ich sag ja immer wieder, dass wir zu wenig über unsere Arbeit wissen, und das hier hilft, diesen Zustand zu überwinden.

Eigentlich könnte das alles doch in ein Dashboard eingespeist werden, oder?

Mit dem neuen Update der GEDBAS-Software ist es mir schon aufgefallen: laut der Statistik habe ich nur für 65% meiner Personen Quellenangaben. Das stimmt nicht. Ich habe für alle Quellen , aber manchmal ist es nur „Auskunft von XYZ“. Was definiert die GEDBAS-Software als Quelle?

Vielen lieben Dank Jesper.

Sehr spannend!

Kleine Anmerkung zur Ahnenforschungs-Sucht:
Wenn jemand 20 bis 50 Jahre forscht und vom Virus befallen ist, können schon locker über 100k Person-Daten eingegeben werden.
:grinning::+1:
Als ich vor guten 20 Jahren anfing, gab es auch schon PAF-Dateien über 100k.

10k pro Jahr bei exzessiver Forschung ist möglich.

Viele Grüße und ein gutes neues Jahr
Heinz

PROSIT NEUJAHR

Lieber Jesper

danke für Deine GEDBAS-Übersicht, die wichtig ist.

Auch den Bemerkungen von Herrn Rose möchte ich zustimmen, mit z.-T. eigener
aktueller Erfahrung.

Ich bin gerade dabei meine GEDCOM aus Pro-Gen (*1995) nach Ahnenblatt zu
überführen uns stolpere dabei über Quellen.

Bei Pro-Gen stehen sie alle unter dem tag „1 SOUR“ werden aber von
Ahnenblatt unterschiedlich behandelt. (Die Diskussion mit Herrn Böttcher ist
noch nicht abgeschlossen.)

Ich habe aus diesem Erleben heraus und auch aus anderem gelernt, dass –
leider – GEDCOM keineswegs gleich GEDCOM ist, wie das auch Doris in ihrem
guten Artikel in der letzten CG (4/24) beschreibt. Zum Teil liegt das bei
mir an meiner falschen Nutzung der vorgegeben Felder, aber wohl auch an
anderem.

Gibt es ein Tool, das die eingereichten GEDCOMs auf Komptabilität mit
„GEDBAS-GEDCOM“ überprüft?

In einer alten Version vom TNG habe ich gesehen, dass TNG mich gefragt hat,
was ich mit einem PRO-Gen-tag, den TNG nicht kannte, gemeint habe. Auch der
Stammbaumdrucker hat m.E. eine solche oder ähnliche Funktion.

Nun wünsche ich Dir und Deinen Mitstreitern weiter viel Erfolg beim
weiteren Auf- und Ausbau von GEDBAS-

Liebe Grüße

Wulf

NB: Wer sich auf seinen Lorbeeren ausruht, hat sie am falschen Fleck" (nn)

1 „Gefällt mir“

Bemerkung:

„Wenn jemand 20 bis 50 Jahre forscht und vom Virus befallen ist, können schon locker über 100k Person-Daten eingegeben werden.“

Aber nur, wenn der Forscher seit 20 bis 50 Jahren das Internet nutzt mit COPY AND PASTE.

Ein Vetter von mir hat von ca. 1920 bis etwa 1990 sehr intensiv geforscht und publiziert. Er kam auf ca.7000 eigene Ahnen auf den Formularen aus dem Degener oder Starke Verlag.

Mit freundlichem Gruß

W. v. Restorff

NB: Karl Valentin sagte; „Wenn es regnet, freue ich mich, denn wenn ich mich nicht freue, regnet es auch.“

1 „Gefällt mir“

Auch ich finde die Auswertung interessant. Vielen Dank dafür!

Meinerseits ist bezüglich der Liste der häufigsten Genealogieprogramme - vielleicht als Sonderfall - anzumerken, dass die in GEDBAS erfasste Software nicht zwingend die Bearbeitungssoftware sein muss. Ich z.B. komme auch von PAF und bin vor mehr als 10 Jahren auf dessen Quasi-Nachfolger Ancestral Quest umgestiegen, das ich gerne und weiterhin als Eingabesoftware nutze. Zur Darstellung im Internet werden die Daten in eine webtrees Datenbank übertragen aus welcher ich wiederum die GEDCOM-Datei für GEDBAS generiere. In der Statistik müsste meine Datenbank also unter webtrees erscheinen, obwohl ich primär mit Ancestral Quest arbeite.

Ich selbst habe vor etwa 30 Jahren mit der Familienforschung begonnen, diese aber erst vor gut 10 Jahren deutlich intensiviert. Von Sekundärquellen übernommene Daten unserer unmittelbaren Vorfahren verifiziere ich grundsätzlich in den Originalquellen, sofern ich die Möglichkeit dazu habe. In meiner GEDBAS-Datenbank sind über die 10 Jahre gut 8000 Personen zusammengekommen. 10000 pro Jahr erscheint auch mir persönlich recht viel für eine seriöse Erforschung. In einer kollaborativen Arbeitsweise geht das aber wohl schon.

Große „gesammelte Datenmengen“ helfen mitunter auch nicht wirklich weiter. Erst die letzten Tage stieß ich in Geneanet auf eine Datenbank, in der eine meiner Vorfahrinnen bis zu Karl dem Großen verfolgt wurde. Schon die ersten rudimentären Überprüfungen in den Kirchenbüchern zeigten so viele Ungereimtheiten, dass ich die Qualität der Quelle insgesamt in Frage gestellt und diese verworfen habe.

Apropos Quellen, meine Daten in GEDBAS zeigen gar keine Quellen, das liegt daran, dass diese z.B. Namen von anderen Forschenden enthalten können, was in einer öffentlichen Datenbank datenschutzrechtlich schon problematisch ist, wenn nicht jede einzelne Person zugestimmt hat. Es wird in GEDBAS auch explizit auf diesen Aspekt hingewiesen. Hier hätte ich vielleicht zu Beginn meiner Dateneingabe bei Quellen und Notizen darauf achten müssen, dort solche Angaben zu vermeiden. Nun kann ich nicht mehr sicher ausschließen, dass sie irgendwo doch noch auftauchen. Weil mir aber eine Transparenz sehr wichtig ist habe ich das dadurch gelöst, dass ich für Interessenten, die sich registrieren und ein paar wenige Nutzungsbedingungen akzeptieren, einen individuellen Zugang für meine webtrees Datenbank einrichte, in der Notizen und Quellen erhalten sind. In den GEDBAS Anmerkungen weise ich darauf hin.

1 „Gefällt mir“

Kannn mich nur wiederholen: das ist möglich!

  • selbst in ein Genealogieprogramm eingegeben (Offline-Rechner)
  • ohne jeglichen Import
  • mit Quellenangabe (für mich zwingend notwendig!)

Natürlich funktioniert das nur mit viel Zeit und den jetzigen Möglichkeiten der Online-Suche (bei mir hauptsächlich mit Ancestry und Archion) und guten Datenquellen.
Früher als ich noch ganze Kirchspiele abfotografierte und mit Namen versehen habe, war das nicht machbar.
Ein Weiteres war das aufmotzen meiner Eingabe mit Autohotkey. Hierdurch hat sich der ganze Eingabeprozess drastisch verbessert (mit vollständig belegter Zusatztastatur mit 58 Tasten, welche nicht mal mehr bei mir ausreicht).

Der Einsatz von „Hotstrings“ mit Autohotkey war auch spitze!

Allerdings wird durch die Datenmenge die Zugriffszeit bei der Suche im Programm immer länger … :wink:

… und das Programm wird auch nicht mehr gepflegt.

Viele Grüße Heinz

Basierend auf der GedBas-Umfrage, dessen Auswertung sich in der nächsten Ausgabe der Computergenealogie finden wird, möchte ich noch einen Aspekt hinzufügen:

Längst nicht jede Gedbas-Datei betrifft die Vorfahren des Einstellers. Mindestens 5% der Einsteller teilen Ortsfamilienbücher per GEDBAS.

2 „Gefällt mir“