Hierarchie der Orte und Koordinaten erzeugen

Hallo webtrees User,

aktuell importiere ich meine Daten aus einem anderen Programm nach
webtrees. Dabei bin ich auch am Überlegen, wie ich meine Ortsdaten auf
Vordermann bringen kann. Aktuell habe ich ca. 800 Orte, die mit dem
_LOC Tag verwaltet werden, jedoch keine Hierarchie oder Koordinaten
enthalten.

Hat jemand von Euch Erfahrungen beim Anlegen der Hierarchie und
Koordinaten? Wie kann ich hier effizient vorgehen und den Aufwand
begrenzen?

Bei www.geonames.org habe ich einen interessanten Download gefunden,
welcher die Orte aus Deutschland und eine administrative Hierarchie enthält:
http://download.geonames.org/export/dump/DE.zip .

Aus diesen Daten müsste man eine Hierarche "Ort, Landkreis, Bundesland,
Deutschland" automatisch aufbauen können. Die Lat/Lon Koordinaten wären
hier auch schon dabei.

Eine weitere Idee wäre eine Openstreetmap-Abfrage über ein overpass
Skript. Habe hier Mal eine Draft-Version für eine Koordinatenabfrage
erstellt: overpass turbo
(Skript ist links; Ergebnis rechts; rechts auf "Daten" clicken)

Hat jemand schon mal versucht, eine Ortshierarchie automatisch zu erzeugen?

Viele Grüße

Markus

Markus Hemprich
www.familienforschung-hemprich.de
Ich erforsche alle Vorkommen HEMPRICH

Hallo Markus,
Wichtig ist, sich von Beginn an eine Systematik zu überlegen, die man dann konsequent durchhält. Das hängt aber stark vom Forschungsgebiet ab.
Bei mir hat sich bewährt: Ortsbezeichnungen - Nomenklatur <Häufig gestellte Fragen – myAncestry - Genealogie der Familien Bernd, Dargel, Prescher, Klepp, Wendenburg u.a.;

Herzlichst, Marko (Dargel)

Hallo webtrees Liste,

mittlerweile habe ich auch die Vesta-Module bzw. SharedPlaces
installiert und ausprobiert. Damit kann ich meine _LOC Strukturen in
webtrees ganz gut übernehmen und die Hierarchie der Orte aufbauen. Es
läuft noch nicht alles ganz perfekt; aber die prinzipiellen
Möglichkeiten sind ersichtlich.

Aus dem unten erwähnten GeoNames-Download habe ich eine Datei mit der
Ortshierarchie für Deutschland (ca. 80.000 Ortseinträge) generiert. Ich
habe dabei einige Doppeleinträge weggefiltert; ist noch nicht perfekt
aber funktioniert schon ganz gut. Wer Interesse hat, kann sich bei mir
melden.

Ich kann jetzt ca. die Hälfte meiner aktuellen _LOC Orte automatisch
zuordnen und bekomme für diese Orte dann automatisch die Ortshierarchie
(Landkreise, Bundesländer, ...) und auch die Koordinaten zugeordnet.
Leider verbleiben noch weitere 500 Orte, die spezifisch nachgearbeitet
werden müssen.

Also die Sache ist schon ziemlich aufwändig. Meine Hauptmotivation liegt
eigentlich eher bei den Koordinatenangaben; aber wenn ich daran arbeite,
kann die Ortshierarchie parallel entstehen. Die Zuordnung von GOV-IDs
wäre dann nochmal eine weitere Großanstrengung.

Grüße

Markus

Hallo Markus,

ich habe schon immer eine vierstufige Hierarchie verwendet: Ort, Landkreis, Bundesland, Staat. Aus diesen Angaben kann man mit den Vesta-Modulen in webtrees automatisch eine hierarchische _LOC-Struktur erstellen lassen, d.h. es gibt dann _LOC-Datensätze für die Orte, für die Kreise, ... etc. Man kann das auch noch erweitern, ich habe etwa einen _LOC-Datensatz für einen Bauernhof oder für ein Schloss, dann einen hierarchisch übergeordneten Datensatz für den Ortsteil/Stadtteil, ... Allen diese _LOC-Datensätzen ordne ich die GOV_ID zu, so dass man in webtrees auch die historische Hierarchie sieht.

Damit sind wir beim nächsten Punkt: welche Bezeichnungen verwendet man für Ortsangaben? Ich habe für mich festgelegt: heutige Ortsbezeichnungen in der heutigen Sprache, die am Ort vorzugsweise gesprochen wird, ggf. aber in lateinischen Buchstaben (und nicht etwa in kyrillsch). Als Landesbezeichnung verwende ich immer den ISO-3-Ländercode, etwa DEU. Andere Leute verwenden für den Staat immer den englischen Landesnamen. Damit heißen bei mir zum Beispiel Orte so wie sie heute auf polnisch heißen und mit der heutigen polnischen Verwaltungshierarchie. Wie gesagt in der webtrees-Oberfläche sieht man sie bei einem Event dann ja durch GOV auch in der damaligen deutschen Bezeichnung in der damaligen Hierarchie.

Die _LOC-Datensatzstruktur ist in einem Addendum GEDCOM 5.5.1 Specification - GEDCOM-L Addendum zum GEDCOM-Standard durch deutsche Genealogieprogrammautoren festgelegt worden. Es gibt aber meiner Kenntnis nach nur webtrees als einziges Programm auf dem Markt, das auch hierarchische _LOC-Datensätze unterstützt.

webtrees an sich unterstützt unabhängig von _LOC eine hierarchische Ortsverwaltung durch eine Datenbanktabelle (die sich also nicht per GEDCOM transportieren läßt). Diese Ortsverwaltung ist Stammbaum-übergreifend, also für alle in einer webtrees-Installation vorhandenen Trees. Dazu kann man dort auch csv-Dateien importieren und so den Orten Koordinaten zuordnen, entsprechende Tabellen für die größeren Orte in Deutschland gibt es fertig, aber mit Deinem sehr spannenden Ansatz mit dem overpass-Script kannst Du dir eine solche csv-Tabelle auch selber erzeugen und in webtrees importieren.

Es gibt in webtrees auch einen Datenkorrekturassistenten mit dem man Ortsdaten gezielt ändern kann. Falls Du also etwa 300 mal irgendwo den Ort "Hintertupfingen" hast, kannst Du mit einem Schlag diese Angaben in "Hintertupfingen, Duselkreis, Baden-Württemberg, DEU" ändern. Trotzdem bleibt noch viel Handarbeit. Danach kann man aber recht schön sehen: wieviele Personen gibt es in welchem Bundesland, wer wohnt in in welchem Landkreis?

Viele Grüße
Hermann

Hallo Hermann,

der Ansatz für die Orsthierarchie mit "Ort, Landkreis, Bundesland,
Staat" zu arbeiten (empfohlen auch von Marko), müsste bei mir auch gut
passen.

Die Sache mit den sperrig langen Namen hat mich auch schon beschäftigt.
Deinen Ansatz, dann bei den Staaten mit Abkürzungen (DE, FR, etc. bzw.
DEU, FRA) zu arbeiten, plane ich auch ein.

Die Sache mit den Ortsteilen und lokal verfeinerten Strukturen ist mir
dagegen noch nicht so klar. Sortierts Du dann einen Ortsteil, eine
Kirche, einen Friedhof ebenfalls auf Ortsebene (bzw. unterhalb von
Landkreis) ein? Oder gehst Du dann noch eine Ebene tiefer? In der GEDCOM
Spec habe ich gelesen, dass man die gesamtheitlich definierten Ebenen
lokal mit entsprechenden FORM-Tags durchbrechen kann. Dies wird aber
nicht empfohlen. Kann webtrees mit solchen lokalen Abweichungen bzw. den
FORM-Tags zur Gesamthierarchie gut umgehen?

Grüße

Markus

Hallo Markus,

mir ist kein einziges Programm bekannt, das mit FORM korrekt umgehen kann. Deshalb ja auch die Empfehlung zu einer einheitlichen vierstufigen Ortshierarchie mit Ort, Landkreis, Bundesland, Staat oder entsprechend in anderen Ländern, etwa Town, County, State, Country. Damit kann man hoffen, dass man bei Export/Import der GEDCOM-Daten zwischen verschiedenene Programmen nichts verliert. Das sind aber die Angaben die man beim PLAC-Tag macht.

Etwas anderes sind die _LOC-Ortdatensätze, die der Standard ja nicht kennt. Dort kann man die Hierarchie beliebig gestalten, etwa die Hierarchie der _LOC-Datensätze
Bökerhof -> Bökendorf -> Brakel -> Höxter -> Nordrhein-Westfalen -> DEU. Hier gehe ich also bei Bedarf in der Hierarchie auf tiefere Ebenen.

Den Ortsdatensatz Bökerhof weise ich als Ortsdatensatz dem Geburtsort zu, den ich bei PLAC so anlege:
Bökerhof; Bökendorf; Brakel, Höxter, Nordrhein-Westfalen, DEU. Ist aber meine sehr persönliche Art, damit ich bei vier Stufen bleiben kann (die Kommas trennen, das Semikolon nicht), in der untersten Ebene des Ortes steht bei mir dann "Bökerhof; Bökendorf; Brakel", in der zweiten Ebene "Höxter" für den Landkreis, dann "Nordrhein-Westfalen" und "DEU". Man könnte aber natürlich auch auf die vierstufige Hierarchie pfeifen und bei PLAC
Bökerhof, Bökendorf, Brakel, Höxter, Nordrhein-Westfalen, DEU
sechstufig angeben. Wenn man es gut machen will, noch mit einer ergänzenden FORM-Angabe wie etwa "Gebäude, Ortsteil, Gemeinde, Landkreis, Bundesland, Staat", aber wie gesagt, die wird wohl kein Programm richtig verarbeiten. Ich mache das so, weil ich dann dem Ortsdatensatz Bökerhof ein Foto des Gebäudes, eine exakte Koordinate und einen Link zum passenden Wikipedia-Eintrag zuweisen kann. Und weil ich mehrere Personen habe, die genau in diesem Haus geboren wurden oder gestorben sind.

Bei Stadtstaaten wie etwa Berlin muss man sich dann auch noch etwas überlegen. Ich fand die korrekte Angabe "Berlin, Berlin, Berlin, DEU" etwas unsinnig und habe für mich die Konvention aufgestellt, dass ich bei Berlin die Hierarchie "Ort, Landkreis, Bundesland, Staat" breche und bei Berlin "Ortsteil, Bezirk, Berlin, DEU" verwende, also etwa "Frohnau, Reinickendorf, Berlin, DEU". Alles sauber dokumentiert und (hoffentlich) konsistent durchgezogen, so dass ich bei Bedarf in der Zukunft das auch mit einem Suchen/Ersetzen jederzeit wieder in etwas anderes ändern kann.

Viele Grüße
Hermann

Hallo Hermann,

vielen Dank für Deine sehr ausführliche und hilfreiche Beschreibung. Da
muss ich also noch etwa Grips reinstecken. Eigentlich habe ich schon
Bedarf für Objekte unterhalb des Ort-Levels, z.B. Friedhöfe und Kirchen.
Andererseits scheint es keine so richtig konsistente Lösung zu geben.
Eine weitere Möglichkeit wäre vielleicht, Friedhöfe auf Orts-Ebene
einsetzen; aber wirklich nicht schön. Beim Workaround mit ";" bin ich
zögerlich.

Ich werde noch etwas mit der _LOC Hierarchie in Vesta Places herum
experimentieren und mir anschauen was dort mit einer partiellen 5.
Hierarchie
passiert. Und wie das dann wieder exportiert wird.

Danke für den Tipp mit Berlin. Das Thema wird bei mir auch aufschlagen.
Hier werde ich - zumindest auf unterster Ebene - auch anders auffächern.

Viele Grüße

Markus