[Gedbas-dev] Gedbas-Entwicklung

Harm Rieper schrieb:

Jetzt wird das Datenmodell zitiert:

 > Zentraler Bestandteil des Datenmodells ist die Quelle SOURCE.
 > Das kann ein Buch aber auch ein Grabstein oder Gedenktafel sein.

Ausgangspunkt einer Genealogie / Genealogisches Sammelsurium kann doch
nur ein Mensch sein, nie eine Quelle.

Harm,
natürlich ist im „realen Leben“ der Mensch der Ausgangspunkt.
ABER:

In der genealogischen Forschung haben wir AM ANFANG nicht
den Menschen, sondern z.b. einen Eintrag im Kirchenbuch, also die QUELLE.

Dort sind in der Regel Angaben über mehrere Personen zu finden.
Aus diesen Quellennachweisen werden dann PERSONEN, aber ob
bei 2 verschiedenen Quellennachweisen tatsächlich beides Mal die
gleiche Person gemeint ist, ist eigentlich schon eine Annahme des
Forschers. (die natürlich meist 100% treffend ist, aber eben auch sehr
vage sein kann).

Hallo Klaus-Peter,

> In der genealogischen Forschung haben wir AM ANFANG nicht
> den Menschen, sondern z.b. einen Eintrag im Kirchenbuch, also die
> QUELLE.

Ich weiss nicht, ich bin bei meiner Forschung von mir - also einem Menschen - ausgegangen, nicht von einer Ansammlung von Geburten, Taufen, ...

Da ich wahrscheinlich der Einzige bin, der Schwierigkeiten mit dieser Denkungsweise hat, möchte ich aus der Aufgabe aussteigen, GedBas den Benutzerwünschen anzupassen, z.B.
  Anzeige aller Daten, die geladen wurden,
  Abfrage beim Laden einer weiteren Genealogie pro Anwender, ob
   vorhergehende gelöscht werden soll,
  Erweiterte Suchmöglichkeiten über sog. phonetische Schlüssel,
  Konkrete Suche nach Orten unter Ausschluß von Teilzeichenketten,
  Suche nach Namen in Zeiträumen,
  Erweiterung der Datenbasis für die Meta-Abfrage,
  und vieles mehr was in den letzten Jahren im Zusammenhang mit GedBas
  angesprochen wurde.

Das Problem mit der Gesamtverwandschaftstafel ist aus meiner Sicht ganz einfach zu lösen. Einer muss sich diesen Schuh anziehen und ein Gen-Programm nehmen und die Daten eingeben. Wenn eine Gruppe die Datenerfassung macht, muss eine Redaktion darüber entscheiden, ob diese Daten aufgenommen werden oder nicht. Das ist eben der Unterschied zwischen Wikipedia mit vielen und guten und richtigen Wissen gegen über dem Brockhaus mit vielen und guten und richtigen und geprüften Wissen.
Also Dubletten kann man nur vermeiden wenn ein intelligentes Wesen den Einzelfall betrachtet und entscheidet, wobei eine Maschine zur Unterstützung hilfreich sein kann, aber nicht der Entscheider. Seht Euch doch mal Karl den Großen in Gedbas
   Karl I d.Gr. =Charlemagne Kaiser v.Dtld+Frankn
und bei Stoyan
http://www8.informatik.uni-erlangen.de/cgi-bin/stoyan/l1/LANG=germ/INDEX=I204807

Was ist denn richtig? Ich glaube, dass für die Entscheidungsfindung sehr viel Zeit und Sucharbeit investiert werden muss, z.B. viele Bücher ausgewertet werden müssen und der menschliche Geist strapaziert werden muss.

Warum ich mich so aufrege? Weil ich der Meinung bin, wenn GedBas heute alle Daten gemäß der GedCom Beschreibung 5.5.1 plus den gewünschten Erweiterungen (in GenWiki beschrieben) speichert und anzeigt, dann benötigen wir kein neues Datenmodell und könnten unsere knappen Kräfte auf Aufgabenstellungen wie nachfolgend konzentrieren:

Aufgabenstellung
Um die Namenssuche bei der Verwaltung der Patientendaten zu verbessern, wird ein neuer Algorithmus benötigt.
Dieser soll für jeden Namen aus der Datenbank eine Zeichenfolge erzeugen, die dann in den entsprechenden Tabellen abgespeichert wird. Die identischen Zeichenfolgen, das heißt also die phonetisch ähnlichen Namen, werden über einen Index verknüpft und können so schnell gefunden werden.
Wird in der Eingabemaske eine Ähnlichkeitssuche ausgeführt, so wird für den entsprechenden Namen die zugehörige Zeichenfolge berechnet und mittels des Index werden alle zu diesem Namen ähnliche Einträge in der Datenbank gefunden.
Zusätzlich sollen neben gleich klingenden Namen auch noch Sonderfälle behandelt werden. Zum Beispiel Namen die das Gleiche meinen, aber unterschiedlich klingen, wie 'Hans' und 'Johann', 'Gretel' und 'Margarethe', 'Schorsch' und 'Georg'. Auch ausländische Namen sollten auf Ähnlichkeit überprüfbar sein, so dass 'Ajsha' gleich 'Aishe', 'Savitzky' gleich 'Sawicki' und 'Wassily' gleich 'Vasilios' gilt.

Wenn man nun Patienten durch Personen ersetzt, dann müsste doch jeder Familienforscher jubeln. Leider war nur die Aufgabenstellung zu finden und auf die Anfrage nach Ergebnissen habe ich bisher noch keine Antwort erhalten.

Eigentlich schade, ich hatte schon ein paar Nächte über manches nachgedacht. Also werde ich meine Zeit wieder mit anderen Dingen verbringen und wenn es das Aufräumen der Garage ist.

Ade!

Mit freundlichen Grüßen

Harm Rieper
der Autor der CD "Quellen für Familienforscher ..",
grüßt aus dem Zentrum seiner Welt -> Altingen
   inmitten Schwäbisch Arkadien

Hallo Klaus-Peter,

> In der genealogischen Forschung haben wir AM ANFANG nicht
> den Menschen, sondern z.b. einen Eintrag im Kirchenbuch, also die
> QUELLE.

Ich weiss nicht, ich bin bei meiner Forschung von mir - also einem Menschen - ausgegangen, nicht von einer Ansammlung von Geburten, Taufen, ...

Da ich wahrscheinlich der Einzige bin, der Schwierigkeiten mit dieser Denkungsweise hat, möchte ich aus der Aufgabe aussteigen, GedBas den Benutzerwünschen anzupassen, z.B.
  Anzeige aller Daten, die geladen wurden,
  Abfrage beim Laden einer weiteren Genealogie pro Anwender, ob
   vorhergehende gelöscht werden soll,
  Erweiterte Suchmöglichkeiten über sog. phonetische Schlüssel,
  Konkrete Suche nach Orten unter Ausschluß von Teilzeichenketten,
  Suche nach Namen in Zeiträumen,
  Erweiterung der Datenbasis für die Meta-Abfrage,
  und vieles mehr was in den letzten Jahren im Zusammenhang mit GedBas
  angesprochen wurde.

Das Problem mit der Gesamtverwandschaftstafel ist aus meiner Sicht ganz einfach zu lösen. Einer muss sich diesen Schuh anziehen und ein Gen-Programm nehmen und die Daten eingeben. Wenn eine Gruppe die Datenerfassung macht, muss eine Redaktion darüber entscheiden, ob diese Daten aufgenommen werden oder nicht. Das ist eben der Unterschied zwischen Wikipedia mit vielen und guten und richtigen Wissen gegen über dem Brockhaus mit vielen und guten und richtigen und geprüften Wissen.
Also Dubletten kann man nur vermeiden wenn ein intelligentes Wesen den Einzelfall betrachtet und entscheidet, wobei eine Maschine zur Unterstützung hilfreich sein kann, aber nicht der Entscheider. Seht Euch doch mal Karl den Großen in Gedbas
   Karl I d.Gr. =Charlemagne Kaiser v.Dtld+Frankn
und bei Stoyan
http://www8.informatik.uni-erlangen.de/cgi-bin/stoyan/l1/LANG=germ/INDEX=I204807

Was ist denn richtig? Ich glaube, dass für die Entscheidungsfindung sehr viel Zeit und Sucharbeit investiert werden muss, z.B. viele Bücher ausgewertet werden müssen und der menschliche Geist strapaziert werden muss.

Warum ich mich so aufrege? Weil ich der Meinung bin, wenn GedBas heute alle Daten gemäß der GedCom Beschreibung 5.5.1 plus den gewünschten Erweiterungen (in GenWiki beschrieben) speichert und anzeigt, dann benötigen wir kein neues Datenmodell und könnten unsere knappen Kräfte auf Aufgabenstellungen wie nachfolgend konzentrieren:

Aufgabenstellung
Um die Namenssuche bei der Verwaltung der Patientendaten zu verbessern, wird ein neuer Algorithmus benötigt.
Dieser soll für jeden Namen aus der Datenbank eine Zeichenfolge erzeugen, die dann in den entsprechenden Tabellen abgespeichert wird. Die identischen Zeichenfolgen, das heißt also die phonetisch ähnlichen Namen, werden über einen Index verknüpft und können so schnell gefunden werden.
Wird in der Eingabemaske eine Ähnlichkeitssuche ausgeführt, so wird für den entsprechenden Namen die zugehörige Zeichenfolge berechnet und mittels des Index werden alle zu diesem Namen ähnliche Einträge in der Datenbank gefunden.
Zusätzlich sollen neben gleich klingenden Namen auch noch Sonderfälle behandelt werden. Zum Beispiel Namen die das Gleiche meinen, aber unterschiedlich klingen, wie 'Hans' und 'Johann', 'Gretel' und 'Margarethe', 'Schorsch' und 'Georg'. Auch ausländische Namen sollten auf Ähnlichkeit überprüfbar sein, so dass 'Ajsha' gleich 'Aishe', 'Savitzky' gleich 'Sawicki' und 'Wassily' gleich 'Vasilios' gilt.

Wenn man nun Patienten durch Personen ersetzt, dann müsste doch jeder Familienforscher jubeln. Leider war nur die Aufgabenstellung zu finden und auf die Anfrage nach Ergebnissen habe ich bisher noch keine Antwort erhalten.

Eigentlich schade, ich hatte schon ein paar Nächte über manches nachgedacht. Also werde ich meine Zeit wieder mit anderen Dingen verbringen und wenn es das Aufräumen der Garage ist.

Ade!

Mit freundlichen Grüßen

Harm Rieper
der Autor der CD "Quellen für Familienforscher ..",
grüßt aus dem Zentrum seiner Welt -> Altingen
   inmitten Schwäbisch Arkadien

Hallo,

sorry f�r die doppelte Nachricht, ich habe mich mal wieder mit den Absendern verhaspelt ......

Alzi l�sst gr��en ......

Mit freundlichen Gr��en

Harm Rieper
der Autor der CD "Quellen f�r Familienforscher ..",
gr��t aus dem Zentrum seiner Welt -> Altingen
   inmitten Schw�bisch Arkadien