Hallo,
dieses ist ein langer und theoretischer Beitrag.
Die Beschäftigung mit Datenmodellen ist nun einmal Theorie, im Gegensatz zu der Beschäftigung mit realen Modellen wie Claudia Schiffer oder Naomi Campbell. Aber dafür ist diese Mailing-Liste eigentlich nicht vorgesehen - Sie haben die Wahl. Und eines versuche ich auch, die mir eigene Polemik im Zaum zu halten, aber manchmal gelingt es eben nicht.
Nachdem Jesper Zedlitz sich bei seinem Vorschlag auf das Gentech Datenmodell bezogen hat, habe ich mir diese Dokumentation mal näher angeschaut (siehe unter: http://wiki-en.genealogy.net/GDM).
Ob ich alles richtig verstanden habe weiß ich nicht. Das Dokument wurde in amerikanischen Englisch Ende der 90er Jahre verfasst, meine britischen Englischkenntnisse stammen noch aus der Schulzeit und wurden mit ein wenig Praxis über die Runden gerettet und mein – zwar dickes – Wörterbuch stammt von Anfang der 90er Jahre und basiert zum größten Teil eben auf britischen Englisch. Warum isch das so betone? Falls man das Dokument zur Hand nimmt findet man z.B. einen Abschnitt über 'Expert Systems' (ab Seite 94). Nur unter 'Expert Systems' habe ich bisher Expertensysteme – womit sich Prof. Stoyan in Erlangen beschäftigt – verstanden und nicht weitergehende Analysen von Datenfeldern und -inhalten. Daher interpretiert ein amerikanischer Genealoge und Computerexperte das Papier ganz anders als ich. Was ich damit sagen möchte ist, dass man für ein Datenmodell die verwendete Sprache – sowohl die technische wie auch die verbale - voll verstehen muss, um alle Feinheiten zu begreifen. Aber lohnt es sich das Papier zu übersetzen? Wohl kaum, denn vermutlich werden sich nur wenige für so ein Datenmodell interessieren.
Was ist neu im Datenmodell?
Im Grunde bringt das Modell nicht viel Neues - wie soll es auch - denn mit Daten und Genealogie beschäftigt man sich seit vielen Jahrzehnten. Neu ist, dass man sich zusammengesetzt hat und alle Daten, die für einen Genealogen interessant sind, geordnet und in Beziehungen zueinander gebracht hat. Dabei spielt es nun keine Rolle, ob man die Ergebnisse als Entity Relationship Model (ERM), oder in der 'Unified Modeling Language (UML)' darstellt, wie Stan Mitchell es getan hat. Letzteres ist wie eine Übersetzung in eine andere Sprache anzusehen.
Was für mich an dem Modell neu ist, dass man Teile eines Projektmanagements ('Projekt:Ich suche Großvaters Geburtsdatum') und eine erweiterte Quellenverwaltung ('Lagerorte: Das Deutsche Geschlechterbuch kann ich in der Vereinsbibliothek, in der Landesbibliothek, in der Uni-Bibliothek einshen') integriert hat. Bisher hatte man diese Dinge im Kopf, auf Notizzetteln oder sonst wo. Im Grunde macht es Sinn, dass man alle Informationen zu seiner genealogischen Forschungsarbeit an einer Stelle vereint.
Was sind die Schwachpunkt?
Aus meiner Sicht kommt die Prozessbeschreibung 'Genealogische Forschung mit einer Seite Text und einem Diagramm etwas zu kurz. Da hätte ich mir mehr gewünscht, denn ich bin der Meinung, dass amerikanische Familienforscher unter anderen Bedingungen arbeiten als wir deutsche. Und da das Papier an amerikanische Forscher gerichtet ist sind die Grundannahmen nicht genügend beschrieben. (Das ist z.B. eine der Schwierigkeiten zwischen Fachleuten und Außenstehenden, dass die Fachleute unter einem Begriff mehr verstehen als der Laie, z.B. wenn man für einen Sparbetrag Zinsen erhält ist dem Fachmann klar, dass es sich um einen Zinseszinsrechnung handelt, dem Anlegen nicht immer. Es gibt sicher bessere Beispiele).
Auch könnte man das gesamte Modell besser verstehen, wenn das Prozessmodell mit dem Datenmodell abgeglichen wäre, im Sinne 'Welche Daten werden bei welchem Prozessschritt angelegt oder verändert'.
Dann fehlt die Vorstellung der Teilnehmer an dem Modellierungsprozeß. Namen wurden zwar genannt, aber über deren Erfahrungen und Tätigkeiten wurde nichts ausgesagt. Und es waren hochkarätige Genealogen, nur musste man sie nachträglich mit Google suchen (oder nur wir Ausländer?).
Ein weiterer Schwachpunkt bei dem Modell ist die Begrenzung auf eine Genealogie.
„An observation should be made at this point about the relationship between evidential data and multiple projects. A professional genealogist, for example, will gather evidence for a particular PROJECT, but at a later time may find some of that same evidence useful for another client and another PROJECT. The data model does not demonstrate a direct connection between SOURCE and PROJECT, so we cannot look at the model and say, for example, a SOURCE is used for one (or perhaps zero) to many PROJECTs.“
Aber dieses können wahrscheinlich die meisten Genealogieprogramme nicht (z.B. kann man in GF-Ahnen die Hilfstabellen wie Quellen, Orte u.ä. für mehrere Genealogien verwenden, was die 'doppelte Buchführung' ersparte).
Was fehlt im Datenmodell?
Aus meiner Sicht fehlen im Datenmodell zwei Dinge, einmal eine Entität 'Begründung' und einmal die Darstellung einer 'Quelle in der Quelle'.
Zu der Ableitung, Annahme, Aussage, Behauptung, Beteuerung, Erklärung, Faktum, Geltendmachung, Versicherung (Assertion) ist in manchen Fällen eine Begründung notwendig. Nicht in jeden Fall, aber z.B. wenn ich eine Person, von der ich aus den Kirchenbücher die Lebensdaten habe mit dem Namen auf einer Passagierliste eines Auswandererschiffs verbinde, dann sollte man es begründen. Oder wenn ich eine Aussage (Assertion) als nicht zutreffend kennzeichne, dann sollte man dieses begründen. Man könnte dieses als Notizen zu der Aussage (Assertion) behandeln, aber da die Begründung nicht immer notwendig ist, so ist es in einem Datenmodell als eigene Entität darzustellen.
Die zweite Sache die aus meiner Sicht fehlt ist die 'Quelle in der Quelle'. Wenn z.B. im Buch 'Das Leben des Paul Proband' der Hinweis 'Laut Taufregister wurde Paul Proband am 13. März 1750 geboren' steht, dann ist die Quelle für diese Aussage (Assertion) das Buch 'Das Leben des Paul Proband' . Dass sich daraus ein Projekt 'Suche Geburtsdatum von Paul Proband' ergibt ist klar, aber da ich die Quelle nicht kenne (es ist irgend ein Taufbuch) habe ich momentan Schwierigkeiten, diese im Datenmodell unterzubringen.
Was ist aus dem Datenmodell geworden?
Also zu erst einmal, ich bin der Meinung, dass ich das Datenmodell in Gen_Plus abbilden kann. Und mit etwas kreativer Phantasie auch das Projektmanagement (Adminstration) und die Quellenverwaltung und Analyse (Evidence). Aber keine Angst Herr Berwe, daraus leite ich – zumindest in absehbarer Zeit – keine Anforderungen an Gen_Plus ab.
Wenn es ein Programm gibt, das sich dem Datenmodell angenähert oder sogar implementiert hat, könnte das Programm 'The Master Genealogist' sein. Laut Programmbeschreibung unter:
Online Casino – Bonus, Casino Spiele und gratis Vergnügen! findet man Funktionen die im Datenmodell beschrieben wurden.
Ob FamilyTreMaker 2008 (FTM), das ja gerade komplett neu entwickelt wurde, auf dem Datenmodell basiert, muss erst noch untersucht werden (ich hoffe, dass ich nächstes Jahr das Programm erhalte). Wenn ich mir FTM 2006 anschaue, dann findet man Ähnlichkeiten. Und ob PAF – die Mutter aller Genealogieprogramme – das Modell unterstützt, kann ich nicht beurteilen, aber ich habe in diesem Fall keine große Hoffnung.
Bei den Programmbeschreibungen der Programme wird das Modell jedenfalls nicht erwähnt.
Bei der Suche mit Google nach Programmenentwicklungen unter dem Gentech Datenmodell habe ich drei Projekte aus dem universitären Umfeld gefunden: ohne genannte Autoren GeneaPro, Stan Mitchell mit GDUML und Hans Fugal mit gdxml. Davon hat anscheinend nur der letztere sein Projekt fertiggestellt. Es handelt sich um eine Anwendung unter XML, die ich bisher wegen mangelnder XML Kenntnisse nicht getestet habe. Die beiden zuerst genannten Projekte sind anscheinend auf der Strecke geblieben.
Herr Zedlitz, haben Sie weitere gefunden?
http://wiki-en.genealogy.net/wiki/Program_based_on_Gentech_data_model
Kurz und Bündig!
Das Gentech Datenmodell beschreibt den größten Teil der bei genealogische Forschungen anfallenden Daten und deren Beziehungen zueinander in sehr guter Weise. Was nach 7 Jahren immer noch fehlt ist die Umsetzung in konkrete Anwendungen.
Ob sich an diesm Zustand was ändern wird, wir werden sehen: GedBas4All.
Doch das ist ein anderes Thema und das folgt demnächst in diesem Theater (so endeten früher jedenfalls die Programmvorschauen im Kino).
Schöne Weihnachten!
Mit freundlichen Grüßen
Harm Rieper
der Autor der CD "Quellen für Familienforscher ..",
grüßt aus dem Zentrum seiner Welt -> Altingen
inmitten Schwäbisch Arkadien