Re:Re: 4) Vergleichen von 2 Gedcom-Dateien"Duplikats-Differenz-Vergleich"

Hallo Kurt,

das war mit dem Bonus gemeint.
Wenn hier noch eine Qualit�t ("weitere 50 Ahnen im Datensatz B", oder
"weitere 2 Ahnen im Datensatz B)" in der Differenzliste (100 Personen)
angegeben wird, tun wir uns alle noch leichter.

Auch ich lehne ein glattes Verschmelzen entschieden ab!

Diese Ergebnisliste ist eigentlich das Ma� der Dinge f�r mich (im
Augenblick, hahaha).

Was jeder Forscher dann, und wie mit seinem Programm macht und machen
kann, das will und kann ich nicht sagen (jedes Programm hat andere
Voraussetzungen).

Weiterhin warne aber trotzdem vor einfachem unkontrollierten
�bernehmen/Verschmelzen (auch mit dieser dann einfachen Methode).
Ich pers�nlich mache an jede Person eine detaillierte Quellenangabe wann
und woher diese Daten kamen. Das mu� aber auch wieder jeder f�r sich
entscheiden.

Gr��le

Heinz (K�hler)

Lieber Herr K�hler, lieber Herr Neugebauer,
es hat keinen Zweck, gute Dateien zu verschmelzen,
h�chstens die unverbundenen Daten der Momonen.

Von dem kleineren Datensatz erstelle ich einen
Bericht in Paf. Dann kann ich wunderbar vergleichen,
wo noch etwas dazugekommen ist. Diese neuen
Daten, besonders - wenn es viele sind, speichere ich
als Gedcom-Datei ab, hole sie in meine beste Datei
und verkn�pfe die Daten dort. Einzelne Daten erg�nze
ich lieber von Hand. In dem PAF-Bericht werden auch
immer die Eltern der einheiratenden Person - egal ob
Mann oder Frau - angegeben, so dass man auch
da evtl. verbinden kann.

Das alles macht zwar viel Arbeit, aber sonst hat man
in seiner besten Datei nur Kuddelmuddel.
Man kann ja auch ruhig 2 Dateien nebenher laufen lassen,
einmal die beste und dann die andere, wo man evtl. noch
Daten �bernehmen m�chte.

Aber das wird genau das Problem in Zukunft sein.
Es kommen immer mehr GEDCOM-Dateien zustande, was
ja auch sehr sch�n ist. Aber wie bekommt man die
Dateien m�glichst schnell, sehr gut und folgerichtig
aneinander?

Ich habe schon Dateien bekommen, die einfach haarstr�ubend
waren. Der Uropa ist da auf einmal der Sohn des Urenkels.
(Die Katze bei�t sich in den Schwanz!)

Oder - die Kinder scheinen mehrere Eltern zu haben, obwohl diese
bei n�herer Betrachtung die gleichen sind. Wenn man das
eine Elternpaar l�scht, fehlt ein Elternteil, da es angeblich
2 x den gleichen Partner am gleichen Tage geheiratet hat, usw.
Das ist aber auf den 1. Blick nicht immer zu erkennen.

Also Vorsicht beim Verschmelzen, in Zweifelsf�llen lieber
neu eingeben. Vorher muss auf jeden Fall eine Sicherheitskopie
gemacht werden, so dass man noch einmal nachsehen kann,
was nun richtig ist.

Gru�
Eva Holtkamp

Hallo Heinz,

ok, aber hei�t das nicht, den Weg nur halb gehen? Gerade diese restlichen
Schritte bedeuten noch etliche Arbeit, und Metti hat schon den Weg erkannt.

Auch f�r die vorgeschlagenen Schritte 1 und 2 gibt es in den
Genealogieprogrammen verschiedene L�sungen, warum soll hierf�r eine L�sung
auf GEDCOM-Basis erarbeitet werden, aber mittendrin dann aufgeh�rt und
wieder auf nicht so befriedigende vorhandene L�sungen zur�ckgegangen
werden?

Eine Kennzeichnung und sp�tere Kontrolle von eingegangenen Daten finde ich
auch als unbedingt n�tig, wenn die Daten in die eigene Forschung �bernommen
werden. Grunds�tzlich geh�ren Quellenangaben (m�glichst auch der
Originalquellen) unbedingt zu einer seri�sen Forschung.

Viele Gr��e

Kurt (Neugebauer)

Liebe Frau Holkamp,

Das alles macht zwar viel Arbeit, aber sonst hat man
in seiner besten Datei nur Kuddelmuddel.
Man kann ja auch ruhig 2 Dateien nebenher laufen lassen,
einmal die beste und dann die andere, wo man evtl. noch
Daten �bernehmen m�chte.

Aber das wird genau das Problem in Zukunft sein.
Es kommen immer mehr GEDCOM-Dateien zustande, was
ja auch sehr sch�n ist. Aber wie bekommt man die
Dateien m�glichst schnell, sehr gut und folgerichtig
aneinander?

Ich habe schon Dateien bekommen, die einfach haarstr�ubend
waren.

Hier stimme ich Ihnen voll und ganz zu. Nur wenn in der "anderen"
Datei/Datenbank einige Genealogien evtl. auch noch �ber mehrere Generation
direkt parallel laufen, wird alles nur unn�tig aufgebl�ht und
un�bersichtlich. Deshalb daf�r eine gut handhabbare M�glichkeit der
gezielten Bearbeitung. Denn der gro�e Schwung an GEDCOM-Dateien steht uns
sicher noch bevor.

Viele Gr��e

Kurt (Neugebauer)

Nur wenn in der "anderen"
Datei/Datenbank einige Genealogien evtl. auch noch über mehrere Generation
direkt parallel laufen, wird alles nur unnötig aufgebläht und
unübersichtlich.

Das geht aber nicht anders.
Das Programm muss sich die diese zwangsläufig ebenfalls doppelten Personen intern (oder auch einsehbar als Liste) merken und nur die jeweis zu verschmelzenden Personen anzeigen. Nur so kann der Anwender bestimmen welche der Daten die sinnvolleren sind. Für jedes Paar einzeln.
Leider ein muss, da darf keine Automatik ran.

MfG, Metti.

Hallo Eva und andere Mitforscher,

in der fehlenden �bersicht liegt meiner Meinung nach das Problem. Deshalb gebe ich in
meine "lokale Ahnenstammdatei" alle Zuarbeiten per Hand ein, auch wenn es m�hsam ist.
Einerseits habe ich dabei die Kontrolle, welche Personen evtl. schon vorhanden sind und wo
nur noch Erg�nzungen einzugeben sind, andererseits fallen mir syntaktische Fehler sofort
auf. Das schlie�t nat�rlich nicht aus, da� doch doppelte Personen / Familien auftreten
k�nnen. Hier w�re ein Kontrolle _innerhalb_ einer Datei auf m�gliche Dubletten angebracht.
Vielleicht sollten wir einen sinnvollen Algorithmus dazu defenieren.

Beispiel:

Ist eines der Daten Geburt / Taufe / Hochzeit / Sterbe / Begr�bnis
  und Soundex der Namens gleich
dann erfogt Gegen�berstellung, da sehr hohe Wahrscheinlichkeit der Identit�t

oft fehlen in der fernernen Vergangenheit aber auch alle Daten (s.o)
Deshalb sollte in einem weiteren Durchlauf abgeglichen werden:

Ist Soundex der Namen
  und ein Ehepartner / Vorfahre / Nachfahre gleich
dann erfogt Gegen�berstellung, da sehr hohe Wahrscheinlichkeit der Identit�t

Beste Gr��e Thomas