[Gedbas-dev] Gedbas Fragen

Guten Morgen Herr Zedlitz,

danke, dass Sie die Diskussion in strukturierete Bahnen lenken. Da man mich in eine Rolle geschubst hat, habe ich ein paar Fragen an den GedBas-Guru.

1. Welcher GedCom Standard liegt der Datenbank zu Grunde?
   Ist Gedcom 5.5.1 nach der reinen Lehre implementiert?
   Was passiert, wenn Daten nicht zugeordnet werden k�nnen, also die
   Quell-Datei nicht dem Standard entspricht?
   Sind die in GEDCOM 5.5EL – GenWiki geforderten
   Erweiterungen ber�cksichtigt?

2. Soweit ich verstanden habe, werden in Gedbas nur eine Teilmenge der
   gespeicherten Daten angezeigt, erst bei Download der gesamte Umfang.
   (http://wiki-de.genealogy.net/index.php/GedBas_FAQ).
   Wieviele der 6.900 Genealogien sind f�r den Download freigeben?

3. Wieviele der Datens�tze / Genealogien sind nicht nur mit weiteren
   Daten als den Lebensdaten eingesendet worden, also haben Informationen
   wie Quellen, Alias, Comments, u.�.?

4. K�nnte man eine Auswertung erstellen, die zum einen die sog.
   Dubletten (Anzahl reicht m.E.) als gleiche Nachnamen, gleiches
   Geburts- und Sterbedatum (ich glaube das reicht f�r die Erkenntnis
   'Dublette') aufzeigt?

5. F�r mich ist noch immer nicht klar, ob nicht Nachname und
   Lebensdatensdaten als eindeutiger Schl�ssel zu einer Person ausreicht.
   K�nnte man eine Auswertung in dieser Richtung erstellen, ob in den
   5 Mio Datens�tzen au�er Dubletten solche Personen vorhanen sind?
   Steigerung dazu: Wenn man den Nachnamen nur noch als Soundex
   speichert, ist das dann noch ausreichend?

6. K�nnte man die in der CompGen-Liste zu diesen Thema erstellten
   Beitr�ge nicht in die neue Liste r�berziehen (z.B. die ab 1. 11.
   2007)? Dann h�tten man eine Quelle mit allen Beitr�gen.

5. Bitte Gedbas4all und den anderen Beitrag unter dem Titel
   Gedbas f�r Familienforscher zusammenfassen!

   Viele Anregungen sind gut, aber den Brei der daraus gekocht wird ...

Damit Ihr meine Vorgehensweise versteht. Ich habe mal gelernt, dass man zur Beratung / L�sungsfindung / Verbesserung eine Hypothese aufstellt und diese dann versucht zu beweisen. Das Problem dabei ist die Neutralit�t und das 'in Frage stellen' der Annahmen. Aber das habe ich eben gelernt: 'was goht mi mei geschw�tz von gestre a' sorry Jesper, aber Plattdeutsch habe ich nie gelernt.

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
   inmitten Schw�bisch Arkadien

Moin,

Harm Rieper schrieb:

Guten Morgen Herr Zedlitz,

danke, dass Sie die Diskussion in strukturierete Bahnen lenken. Da man mich in eine Rolle geschubst hat, habe ich ein paar Fragen an den GedBas-Guru.

Der bin ich nicht, desalb beantworte ich nur einen Teil der Fragen.
Zum Rest muss Jesper was sagen.

1. Welcher GedCom Standard liegt der Datenbank zu Grunde?
   Ist Gedcom 5.5.1 nach der reinen Lehre implementiert?
   Was passiert, wenn Daten nicht zugeordnet werden können, also die
   Quell-Datei nicht dem Standard entspricht?
   Sind die in GEDCOM 5.5EL – GenWiki geforderten
   Erweiterungen berücksichtigt?

2. Soweit ich verstanden habe, werden in Gedbas nur eine Teilmenge der
   gespeicherten Daten angezeigt, erst bei Download der gesamte Umfang.
   (http://wiki-de.genealogy.net/index.php/GedBas_FAQ).
   Wieviele der 6.900 Genealogien sind für den Download freigeben?

1.920
siehe: GEDBAS: Statistics

3. Wieviele der Datensätze / Genealogien sind nicht nur mit weiteren
   Daten als den Lebensdaten eingesendet worden, also haben Informationen
   wie Quellen, Alias, Comments, u.ä.?

Jesper ...
(wobei in den Gedcom-Dateien durchaus mehr Quelleninformationen
enthalten sein können, als in GedBas angezeigt werden; der
Einsender kann das schliesslich bewusst unterdrücken).

4. Könnte man eine Auswertung erstellen, die zum einen die sog.
   Dubletten (Anzahl reicht m.E.) als gleiche Nachnamen, gleiches
   Geburts- und Sterbedatum (ich glaube das reicht für die Erkenntnis
   'Dublette') aufzeigt?

Kann Jesper sicherlich machen.

5. Für mich ist noch immer nicht klar, ob nicht Nachname und
   Lebensdatensdaten als eindeutiger Schlüssel zu einer Person ausreicht.

Glaube ich nicht. Was machst Du, wenn 2 identische Personen mit
unterschiedlichen Lebensdaten eingegeben wurden? Einer nimmt die
Taufe, einer die Geburt, der dritte gar nichts. Vor allem bei Letzterem
wird die Nummernvergabe eh schwer ....

   Könnte man eine Auswertung in dieser Richtung erstellen, ob in den
   5 Mio Datensätzen außer Dubletten solche Personen vorhanen sind?
   Steigerung dazu: Wenn man den Nachnamen nur noch als Soundex
   speichert, ist das dann noch ausreichend?

Fände ich als Auswertung interessant.

6. Könnte man die in der CompGen-Liste zu diesen Thema erstellten
   Beiträge nicht in die neue Liste rüberziehen (z.B. die ab 1. 11.
   2007)? Dann hätten man eine Quelle mit allen Beiträgen.

Ich denke, wir sollten vielleicht ruhig erstmal in der
CompGenD-Liste bleiben. Solange die Diskussion dort den
meisten nicht über zuviel wird, solange bekommt man dort
bestimmt noch gute Anregungen.