[Gedbas-dev] Gedbas-Entwicklung

Schön, daß sich so viele für die Entwicklung von Gedbas interessieren! Bis
jetzt haben sich 15 Personen bei der Mailingliste eingetragen. Viele "übliche
Verdächtige" aber auch einige neue Namen. :slight_smile:

Leider war ich am Wochenende außer Haus, daher das lange Schweigen.

Bei CompGenD-L werden leider rund um Gedbas viele Themen und Wünsche
vermischt. Mein Ziel für das neue Programm ist eine möglichst verknüpfte
Datensammlung wie es sich Arndt Richter vorstellt. Sehr wichtig ist mir
dabei, daß stets nachvollziehbar, woher Informationen stammen: findet man die
Angabe direkt in einer Quelle oder ist es eine Schlußfolgerung. Im ersten
Fall muß natürlich zu erkennen sein, welche Quelle es ist, im zweiten Fall,
wer die Schlußfolgerung wann gezogen hat.

Ein paar grundlegende Sachen zum Datenmodell und einige konkrete Beispiele als
Diskussionsgrundlage habe ich im GenWiki abgelegt:
http://wiki-de.genealogy.net/Gedbas4all/Datenmodell

Gruß
Jesper

Jesper Zedlitz wrote:

Ein paar grundlegende Sachen zum Datenmodell und einige konkrete Beispiele als Diskussionsgrundlage habe ich im GenWiki abgelegt: Gedbas4all/Datenmodell – GenWiki

Sehr sch�nes Schema ... die Assertions mit Angabe der SourceGroup (also Referenz) wird viel zur Validit�t und Qualit�t beitragen (wird auch interessant sein, sp�ter mal nachzusehen, welche SourceGroup sich als f�hrend herauskristallisieren.)

Denkst Du bereits an ein Filtersystem f�r die einzelne Person?
Soll heissen: Wieviel Information ist absolut minimal n�tig, um eine Person aufzunehmen.
Spontan m�sste eigentlich ein Name, ein Event und eine Quelle reichen. Ohne Quelle (d.h. nicht belegt) sollte eigentlich nichts laufen ...
Verstehe ich das so richtig ?

Gruss
Hanno

P.S. Die Liste ist so eingestellt (anders als bei der CompGen-Liste ...), dass bei "Reply" die Antwort nur an den Einsender geht.
Man muss "Reply All" w�hlen, um der Liste zu antworten ....

Sehr geehrter Herr Zedlitz,

> Bei CompGenD-L werden leider rund um Gedbas viele Themen und W�nsche
> vermischt. Mein Ziel f�r das neue Programm ist eine m�glichst
> verkn�pfte Datensammlung wie es sich Arndt Richter vorstellt.

Da geben ich Ihnen Recht, denn Sie haben aus meiner Sicht eine ganz neue Variante ins Spiel gebracht: die Datenbank der Menschheit oder so �hnlich.

> Sehr wichtig ist mir dabei, da� stets nachvollziehbar, woher
> Informationen stammen: findet man die Angabe direkt in einer Quelle
> oder ist es eine Schlu�folgerung. Im ersten Fall mu� nat�rlich zu
> erkennen sein, welche Quelle es ist, im zweiten Fall, wer die
> Schlu�folgerung wann gezogen hat.

Egal welche auf welche Datenbank man sich bezieht, dieses ist das gr��te Manko vieler Datenbanken (Einsender ist nicht = Quelle, h�chstens Schlu�folgerer) und vermutlich aber auch bei den Datensammlungen der Genealogen (die Quelle wird meistens nicht dokumentiert).

> Ein paar grundlegende Sachen zum Datenmodell und einige konkrete
> Beispiele als Diskussionsgrundlage habe ich im GenWiki abgelegt

Und da hakt es bei mir aus. Tut mir leid, ich bin nur Programmierer gewesen und das zu einer Zeit, als man unter Informatik noch die Besch�ftigung mit der sog. 'Harten Ware' verstand.

Jetzt wird das Datenmodell zitiert:

> Zentraler Bestandteil des Datenmodells ist die Quelle SOURCE.
> Das kann ein Buch aber auch ein Grabstein oder Gedenktafel sein.

Ausgangspunkt einer Genealogie / Genealogisches Sammelsurium kann doch nur ein Mensch sein, nie eine Quelle.

Ein Mensch wird auf irgendeiner Art und Weise zum Individum, zu einer einmaligen Erscheinung (UID, PID, ... ermittelt aus was wei� ich f�r Elementen).

Zu diesem Menschen werden Ereignisse zugeordnet: Geburt, Heirat, Tod, Schule, Studium, ........

Die Ereignisse sind ein- oder mehrfach beschrieben: Quellen

An diesen Ereignissen sind weitere Individien beteilligt: Vater, Mutter, Ehegatte, ....

N�chste Schwierigkeit bei Ihrer Darstellung: Sie verwenden vermutlich Begriffe, die in der heutigen Informatik eindeutig besetzt sind. Ihre Kunden und Mitstreiter sind Leute, die nur etwas von Genealogie verstehen, d.h.diesen m�ssen Sie Ihre Gedanken n�herbringen, nicht Ihren Kollegen und Professoren (oder man muss dual arbeiten).

Dann ist die Verwendung von Notationen oder Programmcode in dieser fr�hen Phase nur verwirrend und sowieso nur etwas f�r Eingeweite.

Um der Sache Willen, bedenken Sie folgenden Lehrsatz: Keep it simple!

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
   inmitten Schw�bisch Arkadien

Hanno V. J. Kolbe schrieb:

Jesper Zedlitz wrote:

Hallo Jesper,
schon raucht mir der Kopp.

Trotzdem Dank!

Gruss
Hanno

P.S. Die Liste ist so eingestellt (anders als bei der CompGen-Liste ...), dass bei "Reply" die Antwort nur an den Einsender geht.
Man muss "Reply All" w�hlen, um der Liste zu antworten ....

Das aber sollte ge�ndert werden, denn wenn ich es nicht lese,
nicht lesen kann, dann werde ich es wohl nie verstehen.
Jedenfalls versuchen will ich es aber.

Viele Gr��e
Klaus (Vahlbruch) aus Hamburg-Altona

Hanno V. J. Kolbe wrote:

Denkst Du bereits an ein Filtersystem für die einzelne Person?
Soll heissen: Wieviel Information ist absolut minimal nötig, um eine
Person aufzunehmen.

Ja, denn die ungefilterten Informationen kann man Benutzern (zumindest auf
ersten Blick) nicht zumuten.

Das stelle ich mir so vor: Wenn alle Informationen widerspruchsfrei
zusammenpassen, z.B. in einer Quelle das Geburtsjahr mit 1900 angegeben ist,
die andere Quelle 6. August 1900 angibt, führt man die Informationen zu einem
Eintrag auf einem üblichen Personenblatt zusammen. Hinter dem Eintrag für den
Geburtstag verstecken sich zwei Verweise auf die genaue Quellenangabe.

Taucht ein Widerspruch auf, werden beide Informationen angegeben. Denn dann
ist in jedem Fall noch Nachforschungsbedarf vorhanden.

Spontan müsste eigentlich ein Name, ein Event und eine Quelle reichen.
Ohne Quelle (d.h. nicht belegt) sollte eigentlich nichts laufen ...

Denkbar wäre es, keine Quelle anzugeben, denn wir haben bei der
Schlußfolgerung ja noch den Forscher angegeben. Wir müssen mal überlegen, was
mir mit Angaben wie "hat mir meine Oma 1998 erzählt" machen.

Gruß
Jesper

Hallo Leute,

Ich hatte in der Mittagspause das Konzept mal kurz ueberflogen. Sieht auf den ersten Blick ganz gut aus. Dass nur (per Quellenangabe) verifizierte Daten eingestellt werden koennen faende ich ein bisschen extrem. Da faende ich eine Qualitaets-Skala besser.
Dabei ergeben sich dann allerdings folgende Fragen:

  1. Wie sind die verschiedenen Qualitaets-Stufen gegliedert? (z.B.: fraglich, unsicher, moeglich, wahrscheinlich, sicher)
  2. Wer beurteilt die Qualitaet der Daten? (Ich glaube Peter Teuthorn hatte in dieser Beziehung schon einen interessanten Denkansatz)
  3. Bei Verifizierung der Daten ueber Quellen: Welche Quellen werden anerkannt? Bilder, Dokumente, Verweise auf andere Webseiten? Die Qualitaets-Beurteilung ueber Multimedia-Dateien sollte auch beruecksichtigen, dass nicht alle Daten, die auf Multimedia-Dateien gespeichert sind gut erfassbar sind. Wie geht man mit z.B. Dokumenten um, die schwer lesbar sind oder in denen die Angaben interpretierbar sind (mir machen da gerade Kopien von verschiedenen US Volkszaehlungen Probleme)? Wie sieht’s mit Datenschutz und Urheberrecht aus? Wie mit der Datensicherheit (Hacker-Angriff und Folgen fuer den Verein und Mitglieder)? Schon aus disem Grunde wuerde ich es bevorzugen, dass der Upload von Multimedia-Dateien optional bleiben sollte. Damit wuerde dann natuerlich die Qualitaets-Einteilung mittels Angabe von Quellen sehr eingeschraenkt.

Viele Gruesse,

Dirk

Hallo Harm und Klaus

Um der Sache Willen, bedenken Sie folgenden Lehrsatz: Keep it simple!
  

Was ich bei meinen (sehr positiven) Interaktionen mit Programmierern in den letzten Jahren gelernt habe (war am Anfang auch f�r mich nicht leicht !) :

=> Damit es vor dem Vorhang (Anwenderseite) stabil, einfach und intuitiv ablaufen kann (...das Durchschnittsalter der Anwender sollte wohl bei 50+ liegen ...), muss hinter dem Vorhang ein gewisser Aufwand getrieben werden (Flussdiagramme, logische Zusammenh�nge, Tables, "Zukunftssicht" (das System so anlegen, dass in ihm auch zuk�nftige Erweiterungen 'leicht' angelegt werden k�nnen) , Programmierung, etc. etc. ).
[Gestern den sch�nen Satz geh�rt : Damit man etwas aus dem �rmel sch�tteln kann ... muss man erstmal was 'reintun ...]

Diese englischen Schemata sollten uns nicht abschrecken.

Wir k�nnen ja immer konkret nachfragen ... und ich pers�nlich verlasse mich erstmal angstfrei auf das Urteil derer, die dieses Metier gelernt haben ..., die von uns lernen, was wir wollen ... und denen wir �ber die Schulter schauen d�rfen, wie man das angeht.

Deswegen glaube ich auch, dass eine separate Liste eine gute Idee war, damit wir in 2 - 3 Wochen mit dem "Techno-Gebabbel" nicht den Rest der CompGen-Gemeinde langweilen.

Es zeigt schon erste Wirkungen ... habe gleich meine Familiendatei auf "Homogenit�t der Quellen" durchgesehen ....

Gruss
Hanno

Hallo Jesper,
es w�re sch�n, wenn wir alle mitlesen k�nnten.

Die untenstehende Mail von Dir erschlie�t sich mir nicht.

Mit freundlichen Gr�ssen

Gisbert (Berwe)
-----Urspr�ngliche Nachricht-----

Harm Rieper wrote:

N�chste Schwierigkeit bei Ihrer Darstellung: Sie verwenden vermutlich
Begriffe, die in der heutigen Informatik eindeutig besetzt sind.

Ganz ohne ein paar definierte "Spezialbegriffe" kommen wir nicht aus. Ich
hatte gehofft, sie alle am Anfang von
Gedbas4all/Datenmodell – GenWiki erkl�rt zu haben. Wenn
etwas unklar ist - nochmal nachfragen, ich werde versuchen, es besser zu
beschreiben.

> Dann ist die Verwendung von Notationen oder Programmcode in dieser
fr�hen Phase nur verwirrend und sowieso nur etwas f�r Eingeweite.

Ok, die Textdarstellung war wirklich etwas kryptisch. Ich habe sie durch ein
Diagramm ersetzt:
http://wiki-de.genealogy.net/Gedbas4all/Datenmodell#Heirat
Die Erkl�rung der Farben findet man hier:
http://wiki-commons.genealogy.net/Image:Gdm_diagram_caption.svg

Gru�
Jesper

- --
Dipl.-Inf. Jesper Zedlitz Dept. for Computer Science, CAU of Kiel
Room 1108 Communication Systems Research Group
                                 Phone: +49-(0)431-880-7279
Christian-Albrechts-Platz 4 Fax: +49-(0)431-880-7615
24098 Kiel - Germany jze@informatik.uni-kiel.de

Guten Morgen !

Ich unterst�tze als ersten Ansatz zur Duplikatserkennung in GedBas II die Methode, die Heinz K�hler am 20. 4. 2007 in die CompGen-Liste geschickt hat.

Es geht dabei darum, (a) das Geburtsdatum eines Probanden mit (b) dem Geburtsdatum des Vaters (alternativ: Alter des Vaters bei der Geburt des Probanden) und mit (c) dem Geburtsdatum der Mutter (alternativ: Alter der Mutter bei der Geburt des Probanden) zu kombinieren
um eine Auswahl zu treffen, welche Probanden identisch sein k�nnten / sollten.

Das macht Sinn, denn - dieser Ansatz ist einfach
- Heinz hat an einem Beispiel (J.F. Theurer) gezeigt, dass es Resultate bringt
- und der Ansatz ist evolutionsf�hig (...wenn z.B. durch diese 'Fr�herkennung' die Datenmenge und Qualit�t so ansteigt, dass zus�tzliche Kriterien n�tig werden).

Jeder andere hier eingebrachte Vorschlag sollte / muss an diesen drei Kriterien gemessen werden.

Meinen Wunsch nach einer Indentit�tsnummer (PIN, PID, od. wie auch immer [sollte aber in Englischen wie Deutschen die gleichen Anfangsbuchstaben haben...]) halte ich aufrecht, ziehe ihn aber aus dem Rampenlicht zur�ck.
Der Grund daf�r ist, das ein evolutionsf�higes Duplikatserkennungssystem (s.o.) automatisch n�her und n�her an eine (funktionell getestete !!) Identit�tsnummer heranf�hren wird.

Besten Gruss
Hanno (V.J.Kolbe)

P.S. Einw�nde wie "...und wenn man den Vater od. die Mutter des Probanden (noch) nicht kennt ?"
kann man leicht beantworten mit "... dann ist eben die (Daten-)Qualit�t bei dieser einen, speziellen Person noch nicht hoch genug, um vom Duplikatserkennungssystem ber�cksichtigt zu werden. Voil� !"

Hanno V. J. Kolbe schrieb: