[Gedbas-dev] GedBas4All: Gentech Datenmodell

Harm_Rieper2 · 24. Dezember 2007 um 14:32

Hallo,

dieses ist ein langer und theoretischer Beitrag.
Die Beschäftigung mit Datenmodellen ist nun einmal Theorie, im Gegensatz zu der Beschäftigung mit realen Modellen wie Claudia Schiffer oder Naomi Campbell. Aber dafür ist diese Mailing-Liste eigentlich nicht vorgesehen - Sie haben die Wahl. Und eines versuche ich auch, die mir eigene Polemik im Zaum zu halten, aber manchmal gelingt es eben nicht.

Nachdem Jesper Zedlitz sich bei seinem Vorschlag auf das Gentech Datenmodell bezogen hat, habe ich mir diese Dokumentation mal näher angeschaut (siehe unter: http://wiki-en.genealogy.net/GDM).
Ob ich alles richtig verstanden habe weiß ich nicht. Das Dokument wurde in amerikanischen Englisch Ende der 90er Jahre verfasst, meine britischen Englischkenntnisse stammen noch aus der Schulzeit und wurden mit ein wenig Praxis über die Runden gerettet und mein – zwar dickes – Wörterbuch stammt von Anfang der 90er Jahre und basiert zum größten Teil eben auf britischen Englisch. Warum isch das so betone? Falls man das Dokument zur Hand nimmt findet man z.B. einen Abschnitt über 'Expert Systems' (ab Seite 94). Nur unter 'Expert Systems' habe ich bisher Expertensysteme – womit sich Prof. Stoyan in Erlangen beschäftigt – verstanden und nicht weitergehende Analysen von Datenfeldern und -inhalten. Daher interpretiert ein amerikanischer Genealoge und Computerexperte das Papier ganz anders als ich. Was ich damit sagen möchte ist, dass man für ein Datenmodell die verwendete Sprache – sowohl die technische wie auch die verbale - voll verstehen muss, um alle Feinheiten zu begreifen. Aber lohnt es sich das Papier zu übersetzen? Wohl kaum, denn vermutlich werden sich nur wenige für so ein Datenmodell interessieren.

Was ist neu im Datenmodell?
Im Grunde bringt das Modell nicht viel Neues - wie soll es auch - denn mit Daten und Genealogie beschäftigt man sich seit vielen Jahrzehnten. Neu ist, dass man sich zusammengesetzt hat und alle Daten, die für einen Genealogen interessant sind, geordnet und in Beziehungen zueinander gebracht hat. Dabei spielt es nun keine Rolle, ob man die Ergebnisse als Entity Relationship Model (ERM), oder in der 'Unified Modeling Language (UML)' darstellt, wie Stan Mitchell es getan hat. Letzteres ist wie eine Übersetzung in eine andere Sprache anzusehen.
Was für mich an dem Modell neu ist, dass man Teile eines Projektmanagements ('Projekt:Ich suche Großvaters Geburtsdatum') und eine erweiterte Quellenverwaltung ('Lagerorte: Das Deutsche Geschlechterbuch kann ich in der Vereinsbibliothek, in der Landesbibliothek, in der Uni-Bibliothek einshen') integriert hat. Bisher hatte man diese Dinge im Kopf, auf Notizzetteln oder sonst wo. Im Grunde macht es Sinn, dass man alle Informationen zu seiner genealogischen Forschungsarbeit an einer Stelle vereint.

Was sind die Schwachpunkt?
Aus meiner Sicht kommt die Prozessbeschreibung 'Genealogische Forschung mit einer Seite Text und einem Diagramm etwas zu kurz. Da hätte ich mir mehr gewünscht, denn ich bin der Meinung, dass amerikanische Familienforscher unter anderen Bedingungen arbeiten als wir deutsche. Und da das Papier an amerikanische Forscher gerichtet ist sind die Grundannahmen nicht genügend beschrieben. (Das ist z.B. eine der Schwierigkeiten zwischen Fachleuten und Außenstehenden, dass die Fachleute unter einem Begriff mehr verstehen als der Laie, z.B. wenn man für einen Sparbetrag Zinsen erhält ist dem Fachmann klar, dass es sich um einen Zinseszinsrechnung handelt, dem Anlegen nicht immer. Es gibt sicher bessere Beispiele).
Auch könnte man das gesamte Modell besser verstehen, wenn das Prozessmodell mit dem Datenmodell abgeglichen wäre, im Sinne 'Welche Daten werden bei welchem Prozessschritt angelegt oder verändert'.
Dann fehlt die Vorstellung der Teilnehmer an dem Modellierungsprozeß. Namen wurden zwar genannt, aber über deren Erfahrungen und Tätigkeiten wurde nichts ausgesagt. Und es waren hochkarätige Genealogen, nur musste man sie nachträglich mit Google suchen (oder nur wir Ausländer?).
Ein weiterer Schwachpunkt bei dem Modell ist die Begrenzung auf eine Genealogie.
„An observation should be made at this point about the relationship between evidential data and multiple projects. A professional genealogist, for example, will gather evidence for a particular PROJECT, but at a later time may find some of that same evidence useful for another client and another PROJECT. The data model does not demonstrate a direct connection between SOURCE and PROJECT, so we cannot look at the model and say, for example, a SOURCE is used for one (or perhaps zero) to many PROJECTs.“
Aber dieses können wahrscheinlich die meisten Genealogieprogramme nicht (z.B. kann man in GF-Ahnen die Hilfstabellen wie Quellen, Orte u.ä. für mehrere Genealogien verwenden, was die 'doppelte Buchführung' ersparte).

Was fehlt im Datenmodell?
Aus meiner Sicht fehlen im Datenmodell zwei Dinge, einmal eine Entität 'Begründung' und einmal die Darstellung einer 'Quelle in der Quelle'.
Zu der Ableitung, Annahme, Aussage, Behauptung, Beteuerung, Erklärung, Faktum, Geltendmachung, Versicherung (Assertion) ist in manchen Fällen eine Begründung notwendig. Nicht in jeden Fall, aber z.B. wenn ich eine Person, von der ich aus den Kirchenbücher die Lebensdaten habe mit dem Namen auf einer Passagierliste eines Auswandererschiffs verbinde, dann sollte man es begründen. Oder wenn ich eine Aussage (Assertion) als nicht zutreffend kennzeichne, dann sollte man dieses begründen. Man könnte dieses als Notizen zu der Aussage (Assertion) behandeln, aber da die Begründung nicht immer notwendig ist, so ist es in einem Datenmodell als eigene Entität darzustellen.
Die zweite Sache die aus meiner Sicht fehlt ist die 'Quelle in der Quelle'. Wenn z.B. im Buch 'Das Leben des Paul Proband' der Hinweis 'Laut Taufregister wurde Paul Proband am 13. März 1750 geboren' steht, dann ist die Quelle für diese Aussage (Assertion) das Buch 'Das Leben des Paul Proband' . Dass sich daraus ein Projekt 'Suche Geburtsdatum von Paul Proband' ergibt ist klar, aber da ich die Quelle nicht kenne (es ist irgend ein Taufbuch) habe ich momentan Schwierigkeiten, diese im Datenmodell unterzubringen.

Was ist aus dem Datenmodell geworden?
Also zu erst einmal, ich bin der Meinung, dass ich das Datenmodell in Gen_Plus abbilden kann. Und mit etwas kreativer Phantasie auch das Projektmanagement (Adminstration) und die Quellenverwaltung und Analyse (Evidence). Aber keine Angst Herr Berwe, daraus leite ich – zumindest in absehbarer Zeit – keine Anforderungen an Gen_Plus ab.
Wenn es ein Programm gibt, das sich dem Datenmodell angenähert oder sogar implementiert hat, könnte das Programm 'The Master Genealogist' sein. Laut Programmbeschreibung unter:
Online Casino – Bonus, Casino Spiele und gratis Vergnügen! findet man Funktionen die im Datenmodell beschrieben wurden.
Ob FamilyTreMaker 2008 (FTM), das ja gerade komplett neu entwickelt wurde, auf dem Datenmodell basiert, muss erst noch untersucht werden (ich hoffe, dass ich nächstes Jahr das Programm erhalte). Wenn ich mir FTM 2006 anschaue, dann findet man Ähnlichkeiten. Und ob PAF – die Mutter aller Genealogieprogramme – das Modell unterstützt, kann ich nicht beurteilen, aber ich habe in diesem Fall keine große Hoffnung.
Bei den Programmbeschreibungen der Programme wird das Modell jedenfalls nicht erwähnt.
Bei der Suche mit Google nach Programmenentwicklungen unter dem Gentech Datenmodell habe ich drei Projekte aus dem universitären Umfeld gefunden: ohne genannte Autoren GeneaPro, Stan Mitchell mit GDUML und Hans Fugal mit gdxml. Davon hat anscheinend nur der letztere sein Projekt fertiggestellt. Es handelt sich um eine Anwendung unter XML, die ich bisher wegen mangelnder XML Kenntnisse nicht getestet habe. Die beiden zuerst genannten Projekte sind anscheinend auf der Strecke geblieben.
Herr Zedlitz, haben Sie weitere gefunden?
http://wiki-en.genealogy.net/wiki/Program_based_on_Gentech_data_model

Kurz und Bündig!
Das Gentech Datenmodell beschreibt den größten Teil der bei genealogische Forschungen anfallenden Daten und deren Beziehungen zueinander in sehr guter Weise. Was nach 7 Jahren immer noch fehlt ist die Umsetzung in konkrete Anwendungen.
Ob sich an diesm Zustand was ändern wird, wir werden sehen: GedBas4All.
Doch das ist ein anderes Thema und das folgt demnächst in diesem Theater (so endeten früher jedenfalls die Programmvorschauen im Kino).

Schöne Weihnachten!
Mit freundlichen Grüßen

Harm Rieper
der Autor der CD "Quellen für Familienforscher ..",
grüßt aus dem Zentrum seiner Welt -> Altingen
inmitten Schwäbisch Arkadien

anon49534610 · 24. Dezember 2007 um 14:57

Hallo,
siehe unten.

Mit freundlichen Gr�ssen
und den besten W�nschen zu Weihnachten

Gisbert (Berwe)
-----Urspr�ngliche Nachricht-----

Dr_H.V.J.Kolbe · 25. Dezember 2007 um 14:50

Hallo Harm

Was fehlt im Datenmodell?
Aus meiner Sicht fehlen im Datenmodell zwei Dinge, einmal eine Entität 'Begründung' und ....
Zu der Ableitung, Annahme, Aussage, Behauptung, Beteuerung, Erklärung, Faktum, Geltendmachung, Versicherung (Assertion) ist in manchen Fällen eine Begründung notwendig.

Sehr gute Idee (wenn machbar...).

Wenn ich richtig verstehe, wäre das aber etwas anderes als ein "Diskussionsfeld" (was separat, nur online zur Verfügung stehen könnte; GenWiki-analog).
Ich habe vor ein paar Tagen (in einer Liste) zwei Leser beobachtet, bei denen es um dieselbe (?) Person ging, aber mit leicht verschiedenen Geburts- und anderen Lebensdaten.
Dieses auseinander zu dividieren (und die Abfolge der Diskussion für andere nachvollziehbar zu machen) wäre m. M. n. ein interesantes Feature von GedBasXYZ.
Wenn ein Konsensus erreicht ist, könnte es ja kurz zusammengefasst in der 'Begründung' erscheinen.

Besten Gruss
Hanno

jzedlitz · 25. Dezember 2007 um 15:40

Gisbert Berwe wrote:

Mit einer durchdachen relationalen Datenbank ist das kein Problem, auch
ohne "neues Datenmodel"

Diese Struktur ist dann nicht anderes als ein Datenmodell. Vielleicht reden
wir bereits die selbe Sache nur mit unterschiedlichen Begriffen.

Gruï¿½
Jesper

- --
Jesper Zedlitz E-Mail : jesper@zedlitz.de
Homepage : http://www.zedlitz.de
ICQ# : 23890711

jzedlitz · 25. Dezember 2007 um 15:48

Harm Rieper wrote:

Die zweite Sache die aus meiner Sicht fehlt ist die 'Quelle in der
Quelle'. Wenn z.B. im Buch 'Das Leben des Paul Proband' der Hinweis
'Laut Taufregister wurde Paul Proband am 13. März 1750 geboren' steht,
dann ist die Quelle für diese Aussage (Assertion) das Buch 'Das Leben
des Paul Proband' .

Das ist mir auch schon aufgefallen. Als Idee habe ich eine neue
Datenstruktur "SecondarySource", die zwei Quellen miteinander verknpüft.

Quelle A = Das Leben des Paul Proband
Quelle B = Taufregister
Quelle C (SecondarySource): Qualle A referenziert Quelle B

Ein praktisches Beispiel kann man hier sehen:
<http://wiki-de.genealogy.net/Gedbas4all/Beispiele#Gedcom-Datei_aus_dem_IGI>

Ich bin mir aber noch nicht sicher, ob das der richtige Weg ist oder ob man es
noch einfacher lösen kann.

Bei der Suche mit Google nach Programmenentwicklungen unter dem Gentech
Datenmodell habe ich drei Projekte aus dem universitären Umfeld
gefunden:

[...]

Herr Zedlitz, haben Sie weitere gefunden?

Im Gespräch mit einem Mitarbeiter der Mormonen habe ich erfahren, daß das
neue/geplante familysearch.org auf dem Gentech-Modell basiert. Von den
technischen Details werden wir Außenstehende aber vermutlich erstmal nichts
erfahren.

Gruß
Jesper

- --
Jesper Zedlitz E-Mail : jesper@zedlitz.de
Homepage : http://www.zedlitz.de
ICQ# : 23890711

anon49534610 · 26. Dezember 2007 um 01:04

Hallo Jesper,
ich wei�, was mit einem Datenmodell gemeint ist.
Ich wollte nur darauf hinweisen, dass da nichts neues bei ist, ich hatte im
letzten Jahr schon eine Mail deswegen geschrieben.
F�r mich ist das dass einzig Sinnvolle, da ja nur so beliebig viele Eintr�ge
zu einer Person eingegeben werden k�nnen.

Ich schreibe bewust Person, da ich Familenforschung betreibe, nicht
Quellenforschung.

Mit freundlichen Gr�ssen

Gisbert (Berwe)
-----Urspr�ngliche Nachricht-----

Harm_Rieper · 26. Dezember 2007 um 09:36

Hallo,

in meiner ersten Betrachtung hatte ich noch ein paar Punkte vergessen, die ich jetzt nachholen m�chte.
Zu den Beitr�gen werde ich sp�ter oder in den n�chsten Tagen Stellung nehmen.

Noch einmal ganz deutlich: GedBas4All ist eine ganz anderes Projekt als Genealogisches Archiv. Darum bitte die beiden Sachen auseinanderhalten und somit getrennt betrachten.

So und nun wieder zum Datenmodell.
Was aus meiner Sicht auch noch zu kurz kommt ist eine Betrachtung der Ergebnisse - sprich Ausgaben. Der Hinweis auf 'Compilation: family groups, pedigree charts, and other output formats' ist mir nicht ausreichend genug, denn dort zeigt sich, ob man eine Ahnentafel (Telefonbuchgenealogie, da steht auch nicht mehr drin) oder auf die umfassende Darstellung wie im Deutschen Geschlechterbuch (Her Berwe, noch ein Bonbon) als ideale Darstellungsform empfindet und somit die Bandbreite der Forschung festlegt. Ob es nun Teil des Datenmodells oder des Prozessmodells ist bleibt sich gleich, wichtig ist dass es beschrieben wird.

In diesem Zusammenhang der Hinweis, ich bin kein Anh�nger des EVA-Prinzips (Eingabe - Verarbeitung - Ausgabe) sondern stehe auf dem Standpunkt, dass es AEV-Prinzip hei�en muss. Definiere WAS (Ausgabe) man haben m�chte, dann analysiere die vorhandenen Informationen (Eingabe), die dann aufbereitet werden k�nnen (Verarbeitung).

Auch der Punkt zu der konkreten Beschreibung von Inhalten:
'The group deliberately avoided creating lists of legal values for the various entities and attributes, such as surety values, standard repository lists and abbreviations, research objective keywords, and so forth because we felt that trying to set data value standards was beyond the scope of this phase of the Lexicon project.'
fehlt, was zu Unsch�rfen f�hrt.
Das gleiche gilt f�r die Entity Source, wo man von 'higher lever' und somit auch von 'lower level' spricht. Also ist Source unscharf.

Achtung jetzt kommt Haarspalterei und betrachten einmal eine Quelle:
Ich gehe aufs Pfarramt (Repository) und dort greife ich in den mittleren Schrank (Repository ?) und sehe eine gr��ere Anzahl sog. Kirchenb�cher (Source oder Repository ?) Davon nehme ich das Buch mit dem Titel "Heiraten 1794 - 1870, Tote 1800 bis 1910" (Source oder Repository ?) heraus. Dann finde ich im Teil "Heiraten Heiraten 1700 - 1800" (Source oder Repository ?) auf der Seite 13 (Source oder Repository ?) im Eintrag 2 (Source) den Eintrag, den wir im Beispiel von Jesper Zedlitz auch finden, also in einer weiteren Quelle: Internet, www, GenWiki, Beitrag, Zeilen n-n.
Mir pers�nlich reicht eigentlich 'Kirchenb�cher der Kirchengemeinde xyz', denn da ich die Quelle zu dem Ereignis 'Trauung' an einem bestimmten Datum zugeordnet habe (man beachte die Sichtweise!), ist diese wieder auffindbar. Das ist ja der Hauptzweck einer Quelle. Dass ich diesen Eintrag kopiere, daheim in einem Ordner ablege und sp�ter als Abbildung in der Familienchronik einf�ge ist ja eine andere Sache, aber soweit ich sehe, im Modell darstellbar.

Dass sind aus meiner Sicht weitere Unsch�rfen, die im Datenmodell vorhanden sind.

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Harm_Rieper2 · 26. Dezember 2007 um 10:26

Hallo Herr Berwe,

wenn ich schreibe:

>> Also zu erst einmal, ich bin der Meinung, dass ich das Datenmodell in
>> Gen_Plus abbilden kann. Und mit etwas kreativer Phantasie auch das
>> Projektmanagement (Adminstration) und die Quellenverwaltung und
>> Analyse (Evidence).

dann meine ich, dass man Gen_Plus so verbiegen kann, dass man das Datenmodell abbilden kann, z.B.
  eine Person mit den Namen 'Projekt Suche Gro�vater',
  in Sonst. Daten die einzelnen Schritte mit Pseudo-Dat�mer einstellen,
  eine Quelle zu einem Lagerort verbiegen
   u.s.w..

Wie w�rden Sie reagieren, wenn ich diese Vorgehenweise in der Gen_Plus Mailingliste ver�ffentlichen w�rde?

Also bitte aus einem Bonbon nicht gleich eine Pralinenschachtel machen.

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Gisbert Berwe schrieb:

Harm_Rieper2 · 26. Dezember 2007 um 10:47

Hallo Hanno,

es geht noch nicht um eine 'gro�e' Datenbank, wo mehrere Forscher ihre Ergebnisse ver�ffentlichen. Es geht noch um ein Projekt 'Familienforschung Kolbe' an der nur einer - n�mlich Hanno Kolbe - arbeitet. Und der tr�gt eine Menge an Daten zusammen, die er interpretiert (Aussage = Assertion). Jetzt hat er z.B. aus zwei Quellen unterschiedliche Angaben, z.B. zwei Geburtsdaten. Beide gibt er in seine Datenbank auf seinem PC ein. So nun mu� er sich f�r den Wahrheitsgehalt der Aussagen entscheiden, warum er welches Datum als das 'richtigere' ansieht und es begr�nden.

Da es bei einem ERM um die Vermeidung von doppelter Speicherung und um die Vermeidung von Vorhaltung von Platz ohne Inhalte (Codd, der Erfinder der relationalen Datenbanken hat die Methode 1970 beschrieben, da war Speicher noch schweinisch teuer, nicht in Giga oder Mega, nein ein Computer f�r den Mittelstand hatte maximal 16 Kilobyte Hauptspeicher) geht, ist die Begr�ndung eine eigene Entit�t (Entity), da sie nicht immer vorhanden ist, ansonsten w�rde es sich um ein Attribut handeln.

Oder ein Fall aus der Praxis. In Reit im Winkl (katholisch) lebten zu einer Zeit zwei Ehepaare Johann Blaser und Maria Glapf, ungef�hr im gleichen Alter. Wenn man die Kinder auseinanderhalten will, muss man zuerst das Heiratsdatum ermitteln, das erste Kind kam i.d.R. 12 Monate nach der Hochzeit, manchmal etwas fr�her, aber nicht vor Ablauf von 9 Monaten, sonst w�re es vermerkt worden. Jetzt gibt es die Sitte, dass f�r eine Ehe die Taufpaten immer ein Ehepaar war, er f�r die Knaben, sie f�r die M�dchen. Also 1. Kind nach der Hochzeit = Paten f�r alle nachfolgenden Kinder. Und so k�nnen die Kinder zugeordnet werden. Aber dieses sollte man begr�nden und nicht nur im stillen K�mmerlein behaupten (auch = Assertion).

Sch�ne Nachweihnachten, soweit ich weiss darf man bei Euch schon wieder einkaufen und damit die Weihnachtsgeschenke umtauschen. Wir d�rfen das erst morgen.
Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Hanno V. J. Kolbe schrieb:

jzedlitz · 26. Dezember 2007 um 12:49

Harm Rieper wrote:

Achtung jetzt kommt Haarspalterei und betrachten einmal eine Quelle:

Das ist gar nicht so sehr Haarspalterei, ich habe mich mit dieser Stelle auch
lange beschï¿½ftigt.

Ich gehe aufs Pfarramt (Repository) und dort greife ich in den mittleren
Schrank (Repository ?)

Den Schrank als eigenes Repository zu fï¿½hren, halte ich fï¿½r ï¿½berspefiziert; es
sollte eine Signatur reichen.

und sehe eine grï¿½ï¿½ere Anzahl sog. Kirchenbï¿½cher (Source oder Repository ?)
Davon nehme ich das Buch mit dem Titel "Heiraten 1794 - 1870, Tote 1800 bis
1910" (Source oder Repository ?) heraus. Dann finde ich im Teil "Heiraten
Heiraten 1700 - 1800" (Source oder Repository ?) auf der Seite 13 (Source
oder Repository ?) im Eintrag 2 (Source) den Eintrag,

Im oberen Absatz immer Source mit einem Zeiger auf die "hï¿½here" Quelle, also

Eintrag 2 -> Seite 13 -> Heiraten 1700-1800 -> Heiraten 1794 - 1870, Tote 1800
bis 1910 -> Kirchenbuch der Kirchengemeinde xyz

Mir persï¿½nlich reicht eigentlich 'Kirchenbï¿½cher der Kirchengemeinde
xyz',

Das ist problemlos mï¿½glich, man kann sich auf jede Stufe der Quellenhierarchie
beziehen. Auch eine Representation (z.B. Bilddatei) kann es fï¿½r jede Stufe
geben. Man kann eine ganzes Buch in einer PDF-Datei haben, eine ganze Seite
scannen oder auch nur einen einzigen Eintrag.

Gruï¿½
Jesper

- --
Jesper Zedlitz E-Mail : jesper@zedlitz.de
Homepage : http://www.zedlitz.de
ICQ# : 23890711

Gerd_Schmerse · 26. Dezember 2007 um 14:01

Moin Harm Rieper,

zur Mail vom Wed, 26 Dec 2007 11:47:23 +0100:

So nun mu� er sich f�r den Wahrheitsgehalt
der Aussagen entscheiden, warum er welches Datum als das 'richtigere'
ansieht und es begr�nden.

Warum sollte er das m�ssen?

Gru�
Gerd (Schmerse)

Harm_Rieper2 · 27. Dezember 2007 um 14:14

Hallo Herr Zedlitz,

bevor ich mich mit der Erweiterung der Quellen besch�ftige, m�chte ich
zuerst mich mit Ihren Beitr�gen besch�ftigen.
Und dieses ist wieder mal umfangreich und lang.

Sie schrieben auf Gedbas4all – GenWiki :
'Wir haben unglaublich viele Daten, doch eine Verkn�pfung findet kaum
statt.'

Doch, millionenfach. In den Genealogien der Benutzer der Datenbanken. Nur wir erfahren es nicht, weil es sich ja um 'meine' Daten handelt und unter Verschlu� gehalten werden. Und da sollte das Gen. Archiv ein wenig Abhilfe schaffen...
In der Bundesrepublik besch�ftigen sich zusehend immer mehr Personen mit der Suche nach ihren Vorfahren. Ansonsten w�rden doch nicht Fernsehsender zur besten Sendezeit sich diesem Thema widmen. Mit Jauch oder Gottschalk k�nnen wir noch nicht konkurrieren, aber was nicht ist kann immer noch werden. Leider ist nur ein geringer Anteil von Ihnen in Organisationen zusammengeschlossen und noch weniger sind bereit ihre Ergebnisse der Allgemeinheit zur Verf�gung zu stellen.
Doch das ist ein anderes Thema und sollte dort abgehandelt werden.

Jetzt zu Ihren Beispiel auf
http://wiki-de.genealogy.net/Gedbas4all/Beispiele
Aus dem GENTECH Datenmodell ziehen Sie den Teil Schlu�folgerungen
(Conclusions) heraus und machen diesen zur Basis Ihrer �berlegungen.

Die Heirat, Kopulation, Trauung, ... ja man sieht, die gleiche (oder
selbe ?) Handlung, das gleiche Ereignis, hat viele Namen. In der
Darstellung fehlen noch zwei weitere Aussagen: der Familienstand und
das Geschlecht, letzters kann aus den Vornamen oder aus dem
Familienstand abgeleitet werden. Und dann wird aus Elternteil (Elter) dann Vater oder Mutter.
Und dann die arme vorhergehende Frau vom Christian Gottlieb, die dort
rechts au�en ganz isoliert dasteht. War diese nicht auch durch eine
Heirat mit dem Christian Gottlieb verbunden, hatte die kein Geschlecht?

Und dann beschr�nkt sich das Beispiel auf eine Quellenedition, eine Aufbereitung von einzelnen Eintr�gen in einer Quellensammlung (ist das nicht eine eigene Eintit�t?). Es wird Eintrag f�r Eintrag betrachtet, analysiert und daraus Schlu�folgerungen (Conclusions) gezogen und als Aussagen (Assertionen) festgehalten.
Eine Betrachtung �ber den einzelnen Eintrag hinaus findet mal wieder
nicht statt und wird wie bei dem GENTECH Datenmodell als Auswertung den
Programmieren zugeschoben, oder?
Denn wenn Sie in der Analyse der Quellensammlung weiterfahren findet man
ein paar Seiten vorher folgenden Eintrag:

'1849
Den 27. Dezember wurden getraut: Christian Gottlieb Herrmann,
Kleing�rtner und Schuhmachermeister, des seligen Gottlieb Christian
Herrmann, Schuhmacher hierselbst mit Jungfer Maria Magdalene Sch�ne,
Tochter des hiesigen Maurers Johann Sch�ne eheliche Tochter. Br�utigam
35 Jahr, Braut 31 Jahr'

Und jetzt wird es interessant. Wie bringen Sie die aus diesem Eintrag
entstehenden Aussagen und Verkn�pfungen in Ihrem Datenmodell unter?
St�rt dort nicht die Abh�ngigkeit von der Quelle?
Also ich bin gespannt.

Das sind ja nur die Verkn�pfungen innerhalb der Quellensammlung, wie
verkn�pfen Sie den Geburtseintrag, den Adressbucheintrag, ......
�berlassen Sie das alles dem Programmierer zur freien Interpretation?
Das Ergebnis kann ich Ihnen voraussagen, wie bei GEDCOM, wo jeder f�r sich die richtige Auslegung reklamiert und Fehler immer nur von anderen gemacht werden.

Dann schreiben Sie beim Datenmodell: 'Wird ein Datensatz als gleich erkannt, bekommen beide Bearbeiter eine Mitteilung dar�ber. Erst wenn beide zugestimmt haben, werden die Daten verschmolzen.'

Und wie soll ein Benutzer in seine GEDCOM-Datei eingreifen?
Und wenn nicht, bleibt es bei der doppelten Buchf�hrung?

Weiter schreiben Sie: "F�r einige wichtige Definitionen werden englische Begriffe verwendet, damit man sie auch bei einer sp�teren �bersetzung wiedererkennt."

Wenn man ein Prozess- oder Datenmodell aufstellt, dann sollte es in der Sprache geschehen, in der alle Teilnehmer zu Hause sind. Fremdsprachliche Begriffe sind nach M�glichkeit zu vermeiden, insbesondere das Fachchinesisch der 'Wissenden'. Da man im GENTECH Data Modell ungl�cklicherweise einen Begriff gew�hlt - hier Assertion - hat, der gleichzeitig in der Informatik mit einem anderen Inhalt besetzt ist, bringt nur Verwirrung in die Sache. Deshalb sollte man in der Modellierung von Beginn an festlegen, wer die Adressaten sind, welche Qualifikation vorrausgesetzt wird und deshalb die entsprechende Sprache w�hlen.

Jetzt glaube ich, dass ich gen�gende offene Punkte in die Arena geworfen haben. Bis zum n�chsten Mal.
Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Harm_Rieper2 · 27. Dezember 2007 um 14:44

Guten Tag Herr Schmerse,

>>So nun mu� er sich f�r den Wahrheitsgehalt
>>der Aussagen entscheiden, warum er welches Datum als das 'richtigere'
>>ansieht und es begr�nden.
>
> Warum sollte er das m�ssen?
>

Ja warum eigentlich? Man kann ja einer Person zwei Geburtstage zuordnen. Als Kind h�tte ich mich sehr gefreut, zweimal Geburtstag und einmal Namenstag. Und trotzden sollte man es begr�nden, warum man sich nicht entscheiden konnte.

F�r mich wird eine Person durch
  die Vornamen
  den Nachnamen (nach M�glichkeit der Geburtsname)
  dem Datum der ersten Erw�hnung (Geburt, Taufe, regierte von, ...)
  dem Datum der letzten Erw�hnung (Tod, Beerdigung, regierte bis, ...)
eindeutig identifiziert.
Der Sonderfall der totgeborenen Mehrlingsgeburten kann man durch Anonymus / Anonyma I, Anonymus / Anonyma II usw. eindeutig machen.

Das ist schon einmal ein Vorgriff auf das, was noch kommt, n�mlich was wollen wir denn �berhaupt.

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Harm_Rieper2 · 27. Dezember 2007 um 15:13

Hallo,

> Im Gespr�ch mit einem Mitarbeiter der Mormonen habe ich erfahren, da�
> das neue/geplante familysearch.org auf dem Gentech-Modell basiert. Von
> den technischen Details werden wir Au�enstehende aber vermutlich
> erstmal nichts erfahren.

Heute kam bei mir die Computergenealogie mit dem Beitrag �ber FamilyTreeMaker 2008 an. Mal sehen, wieviel GenTech zu entdecken ist.

Interessant ist aus meiner Sicht, dass nach Ver�ffentlichung der Vorabversion des GENTECH Data Model Dokuments als RFC (Request for Comments, also 'Mit der Bitte um Kommentierung') keine Kommentare abgegeben wurden. War das Modell so perfekt? Hatte es keiner verstanden? Wollte es keiner?

Wie bereits gesagt, nur in der Beschreibung von The Master Genealogist habe ich etwas in der Richtung GENTECH Data Model gefunden. Wird vielleicht daran liegen, dass Bob Velke, President of Wholly Genes, Inc., - dem Hersteller des Programms - Teilnehmer in der Modellgruppe war.

Falls man n�heres wissen m�chte, kann man es evtl. dort erfahren:
ANNOUNCING THE 4TH ANNUAL GENEALOGY CONFERENCE AND CRUISE
The largest family history conference on the seas.
Wholly Genes, Inc., of Columbia, Maryland, is proud to announce the 2008 Genealogy Conference and Cruise, October 26-November 2, 2008...
... Prices for the week-long 2008 Genealogy Conference and Cruise start at about $843 per person (inside cabin, double occupancy) and include the cruise, food, shipboard entertainment, and attendance to all conference events. A roommate-finding service is also available. Complete details can be found at www.WhollyGenes.com/cruise.htm.

Hier noch ein paar interessante Adressen:

Leider gibt es so etwas noch nicht f�r deutsche Programme:
http://genealogy-software-review.toptenreviews.com/

Zu GEDCOM
GEDCOM TestBook Project
https://www.ngsgenealogy.org/ngsgentech/projects/TestBook2001/index.cfm
Aus meiner Sicht �bersichtlicher und eindeutiger als:
http://wiki-de.genealogy.net/GEDCOM-Test

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Klaus_Vahlbruch · 28. Dezember 2007 um 07:53

Harm Rieper schrieb:

Hallo Herr Zedlitz,

[...]

Wenn man ein Prozess- oder Datenmodell aufstellt, dann sollte es in der Sprache geschehen, in der alle Teilnehmer zu Hause sind. Fremdsprachliche Begriffe sind nach M�glichkeit zu vermeiden, insbesondere das Fachchinesisch der 'Wissenden'. Da man im GENTECH Data Modell ungl�cklicherweise einen Begriff gew�hlt - hier Assertion - hat, der gleichzeitig in der Informatik mit einem anderen Inhalt besetzt ist, bringt nur Verwirrung in die Sache. Deshalb sollte man in der Modellierung von Beginn an festlegen, wer die Adressaten sind, welche Qualifikation vorrausgesetzt wird und deshalb die entsprechende Sprache w�hlen.

[...]

Harm_Rieper2 · 28. Dezember 2007 um 09:02

Hallo Mitstreiter,

wie soll es nun weitergehen?

Ich bin der Meinung, dass nun folgende Schritte folgen m�ssen:

a) Festlegen des Ziels
b) Beschreibung des Prozesses mit allen Eingaben und Ausgaben
c) Erstellen eines Datenmodells basierend auf dem GENTECH Data Model
d) Verabschiedung des Prozess- und Datenmodells
e) Umsetzung in eine Anwendung.

Aus den wenigen Beitr�gen der letzten Tage - entweder weil Weihnachten
war oder weil es keinen interessierte - haben ich zumindest nachfolgende folgende Alternativen herausgeh�rt.
Ich habe versucht, diese nach Aufwand zu sortieren, denn dar�ber m�sssen wir uns klar sein, jede Ver�nderung kostet Geld, dass unser Sponsor aufbringen muss.

1. GedBas, GedBas �ber alles
Alles so lassen wie es ist. Das wars dann bis zur n�chsten
Diskussionsrunde.

2. Damit die Container nicht �berlaufen
Ausbau GedBas zu einem Genealogischen Archiv
siehe hier:
http://wiki-de.genealogy.net/GedBas/Wunschliste

3. Damit die Quellen sprudeln
Erweiterung des Angebots der CompGen Datenbanken um eine Datenbank f�r
Quelleneditionen von Kirchenb�cher inklusive der Umstellung der
bisherigen CompGen Datenbanken auf ein neues Datenmodell.
siehe GedBas4All Beispiel Heirat: http://wiki-de.genealogy.net/Gedbas4all/Beispiele

4. Damit man nicht mehr suchen muss
Aufbau einer 'Metasuche-Datenbank' in der eindeutige, nicht redundante
Personen gespeichert werden und Hinweise (Links) auf weitere Vorkommen
der Person, also in OFBs, Quelleneditionen, Mormonen, Internetpr�senzen, B�chern, usw.
Damit beginnt nicht nur ein neues Projekt, sondern es wird Nachfolgeaufwand generiert. Es m�ssen sich Leute bereitfinden, die Qualit�tskontrolle, also die Eindeutigkeit von Personen in der Datenbank sicherstellen. So etwas wie beim Herold f�r Wappen.

4a. W�re eine Datenbank ohne Qualit�tskontrolle, also mit Mehrfachspeicherung.

5. Stammbaum auf Knopfdruck
Aufbau der Historischen Einwohnerdatenbank auf Basis eines neuen
Datenmodells.
Hier werden dann die W�nsche wie einmalige Speicherung von Personen und Familien, Gesamtverwandtschaftsdarstellungen, Regina, schw�bische Geistesmutter, usw. wahr. Aber auch hier m�ssen sich Leute bereitfinden, die Qualit�tskontrolle �bernehmen.

6. Cousinen und Cousin aller L�nder vereinigt euch.
Aufbau einer gemeinn�tzigen Datenbank f�r soziale Kontakte (social
networking) mit einem Blick in die Vergangenheit als Gegengewicht zu
ancestry und den anderen pseudokommerziellen Portalen.

So ich glaube, dass jetzt fast alles gesagt wurde. Wenden wir uns nun der Diskussion zu und kommen dann zu einem Ergebnis. Oder ist diese Entscheidung bereits gefallen?
Sonntag 13. 4. 2008 Bielefeld Waldhotel Brand's Busch
Jesper Zedlitz stellt sein Konzept einer quellengest�tzten Datenbank f�r Genealogen vor

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Harm_Rieper2 · 28. Dezember 2007 um 10:06

Hallo Herr Zedlitz,

was halten Sie davon, wenn wir von

Quelleneintrag f�r low level source = der Text der dort steht
Quellensammlung f�r high level source = die Sammlung der Texte = Kirchenbuch Taufen nnn bis nnn

sprechen. Damit ist eine Unsch�rfe aus dem Modell genommen.

Dann 'Quelle in Quelle', das k�nnte entweder durch ein Datenelement (attribute) in der Entit�t (entity) Quelleneintrag also 'Quelle der Quelle' oder mit einer Verkn�pfung Source-Source dargestellt werden.

Und nun drehen Sie doch einfach mal die Darstellung der GEDCOM Datei um.
Beginnen Sie wie in der Forschung �blich ist mit der Suche und deren Ergebnis:
Zu meinem Gro�vater habe ich das Geburtsdatum gesucht und habe jetzt den Geburtseintrag vor mir liegen. Gefunden habe ich es im Taufbuch 1650 bis 1690 der ev.-luth. Kirchengemeinde von Posemuckel auf einem Mikrofilm im Landeskirchlichen Archiv (Nummer #####).
Au�erdem hat man mich dort darauf aufmerksam gemacht, dass es eine Verkartung des Kirchenbuchs im Ortsarchiv Posemuckel und ein Ortssippenbuch �ber Posemuckel gibt. Letzteres ist im Karlsruher virtuellen Katalog ausgewiesen und kann �ber Fernleihe ausgeliehen werden.
Ich h�tte den Film auch bei den Mormonen anschauen k�nnen.

Das ist doch das Ergebnis einer genealogischen Forschung (project)!
Oder schreiben Sie erst das gesamte Taufbuch ab und schauen dann, welche Personen dort vorkommen? So ist jedenfalls der Eindruck bei Ihren Darstellungen.

Wobei ich Ihnen Recht gebe, in dem Sonderfall genealogischer Forschung - n�mlich der Verkartung von Kirchenb�chern - steht die Quelle im Vordergrund und nicht eine Person.
Und das ist das Problem bei der Definition von Anwendungen, es wird mehr �ber die Sonderf�lle als �ber die normalen Gesch�ftsvorf�lle, und so sehen dann die Anwendungen auch aus.

So das reicht dazu.
Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
inmitten Schw�bisch Arkadien

Jesper Zedlitz schrieb: