Ahnenliste veröffentlichen, wie?

Sehr geehrtes Team,

als Mitglied bei den Sudetendeutschen Familienforschern (VSFF) seit betreibe ich
seit Jahren Genealogie und habe da natürlich eine Menge Daten zusammengetragen.
Als ich damit begann hatte ich natürlich kaum Ahnung, was auf dem Gebiet alles
möglich und üblich ist. So habe ich meine umfangreiche Ahnenliste nach Kekule
einfach mit WORD zusammengebaut. Zudem kommt, dass ich mit MAC arbeite. Als ich
einmal auf Computer-Programme (Reunion) umschwenken wollte, bin ich ziemlich bald
wegen des großen Aufwands beim Umschreiben davon abgekommen. Ich finde es
natürlich schade, dass ich mich mit anderen Forschern so wenig austauschen kann.
Falls Sie da Ideen haben - ich lese sie gerne!

Mit freundlichen Grüßen

Horst Vladar

Hallo Herr Vladar,

wenn Sie auf Umschreiben verzichten wollten, bleibt vermutlich nur die Möglichkeit, Ihre Daten in Auszügen in ein neues Dokument zu kopieren oder die Auszüge in eine PDF-Datei zu drucken.

Falls Sie an der Zusammenarbeit mit anderen Forschern online interessiert sind und zumindest über rudimentäre Englischkenntnisse verfügen, würde ich Ihnen WikiTree ans Herz legen. Unter https://www.youtube.com/watch?v=vcBe-9djwh4 finden Sie einen Vortrag von mir zu Thema. Aber auch dort müssten Sie Ihre Daten einzeln übertragen.

Ansonsten können Sie vermutlich zu jedem beliebigen Ahnenforschungsprogramm wechseln und die Daten dann per GEDCOM-Datei austauschen. Dafür müssen Sie die Daten aber einmal in eins dieser Programme einarbeiten und das wird sehr viel manuellen Aufwand erfordern.

Je nachdem, wie sorgfältig die Daten strukturiert sind, könnte man das vielleicht teilweise automatisieren, aber es wird auf jeden Fall Arbeit machen.

Viele Grüße
Flo(rian Straub)

Wäre das nicht ein Paradebeispiel für die neuen Möglichkeiten der KI?
ChatGPT soll doch eingelesene Texte mit genealogischem Inhalt nach Gedcom exportieren können.

Vielleicht könnte einer unserer KI-Experten was dazu sagen.

1 „Gefällt mir“

Wie sieht die Worddatei denn aus?
Sind die Daten halbwegs einheitlich strukturiert?

Ggf. kann man die Daten in eine Tabellenkalkulation mit je einer Zeile
pro Person übertragen. Das lässt sich mit diversen Programmen in eine
GEDCOM-Datei übertragen.

Gruß, Stefan Mettenbrink.

1 „Gefällt mir“

KI-Programme wie ChatGPT sind gut darin, in einer großen Menge Text ein paar wenige Informationen zu finden; etwa in einer Biografie die Daten zu vorkommenden Personen. Sie sind erst einmal weniger geeignet aus hochverdichteten Informationen andere hochverdichtete Informationen zu erzeugen; also hier aus einer Word-Ahnenliste eine GEDCOM zu erzeugen. ChatGPT ist für natürliche Sprache gemacht, nicht für Ahnenlisten.

Wenn die Liste sehr einheitlich strukturiert ist, dann ist der Ansatz von Stefan der bessere: mit Suchen&Ersetzen aus Word eine Excel-Tabelle erzeugen und diese etwa mit GedTool nach GEDCOM transferieren.

Wenn die Datei doch eher flexibel in ihrer Struktur ist, dann muss man sie für die Verarbeitung durch ChatGPT in kleine Stücke zerlegen und dann analysieren lassen. Dazu muss man ggf etwas programmieren, ggf. mit Hilfe von ChatGPT.

Aber das ist alles Raterei. Horst Vladar, ist die Word-Datei irgendwo veröffentlicht? Reden wir von 10 Seiten oder von 1.000 Seiten? Kannst Du uns hier ein paar typische Abschnitte zeigen?

Viele Grüße Hermann

Sehr geehrter Herr Mettenbrink,

hier sehen Sie die Seite mit der IV. Generation meiner Ahnenliste in WORD. Sie könne natürlich auch in .pdf emacht werden… Ich konnte einige (wenige) Ahnen bis zur XIV. Generation nachweisen. Se wissen sicher, dass z. B. die IX. Generation schon viel umfangreicher (bei mir schon 22 solcher Seiten) ist! (und da sind viele Ahnen schon nicht mehr zu finden - fehlen also). Darum meine ich, dass es leichter/besser wäre, auf einer www, des Vereins Links zu setzen. Vielleicht könnte man ja die dazu gehörige Namen- und Ortsliste dazu angeben.

IV.docx (13.8 KB)

Word ist OK.
Ich würde die Texte in einen Texteditor laden, der suchen/ersetzen mit
regulären Ausdrücken beherrscht (unter Windows beispielsweise Notepad++,
auf meinem Mac nutze ich BBEdit). Dort kannst Du nach den „Trennern“ der
Einzelwerte suchen. Das sieht dann etwa so aus (am Ende müssen in jeder
Zeile die Daten jeweils einer Person stehen und die Einzelbestandteile
in Anführungen gesetzt und durch Komma getrennt sein):

Suchmuster → ersetzt durch
,\n \t* → „,“
, † → „,“
,\n \t∞ → „,“
\n\n[0-9]* \t → \n

Am Schluss noch:
\n"\n"

Mit den Möglichkeiten und der Funktion von regulären Ausdrücken (RegEx)
musst Du Dich etwas befassen. Ist aber kein Hexenwerk.

Damit bekommst Du einen solchen Text (Zeilenumbruch bedingt durch mein
Mailprogramm):
16 W l a d a r s c h, Josef Wilhelm, Gastwirt",„Odrau Nr. 51
01.02.1789“,„Odrau Nr. 55 22.05.1871 (83 J.)“,„Odrau 23.08.1813“
„G e r l i c h (Görlich), Johanna Franziska“,„Odrau-Niedervorstadt Nr. 3
29.03.1794“,„Odrau 19.06.1873 (81 J.)“
„T o m e c (č) z k a, Karl, Bauer“,„Zbraschau Nr. 15
26.05.1812“,„Zbraschau Nr. 15 24.11.1870 (58 J.)“,„Drahotusch 08.10.1833“
„S c h a l a s c h, Johanna“,„Millenau Nr. 7 30.04.1816“,„Zbraschau Nr.
15 09.02.1884 (65 J.)“
„M ü c k, Johann Anton, Webermeister u. Händler,“,„Bodenstadt Nr. 139
03.06.1822“,„Bodenstadt Nr. 158 12.05.1858 (44 J.)“,„Bodenstadt
18.07.1842“
„G l i e r, Cäcilia“,„Bodenstadt Nr. 64 04.06.1819“,"Bodenstadt "
„G r o ß m a n n, Josef, Schuhmachermeister“,„Neu-Waltersdorf Nr. 3
10.12.1813“,„Bodenstadt Nr. 158 12.05.1858 (44 J.)“,„Neu-Waltersdorf
08.10.1838“
„H ö g e r, Zäzilia, Hebamme, aktiv bis 1877 (1846 von Neu-W. n.
Bodenstadt übersiedelt)“,„Bodenstadt 20.11.1809“,„Bodenstadt Nr. 158 n.
1877 (noch am 15.05.1877 als Hebamme aktiv)“
„W i c h a, Valentin, Bauer/Gärtler“,„Briesau Nr. 18
03.01.1841“,„Briesau Nr. 22 10.03.1887 (46 J.)“,„Briesau 01.02.1864“
„M o r a w e t z, Maria“,„Briesau Nr. 6 15.03.1846“,„Briesau Nr. 28
06.06.1868 (22 J.)“
„F r i t s c h, Matthäus (Mathias), Häusler“,„Klantendorf Nr. 43
14.02.1835“,„Klantendorf Nr. 43 27.09.1883 (48 J.)“,„Bielau 13.02.1860“
„F e i l h a u e r, Rosa(lia)“,„Bielau Nr. 47 18.11.1837“,„Klantendorf
Nr. 43 14.04.1878 (39 J.)“
"M ü h r (Mir), Theresia, ",„Deutsch-Markersdorf Nr. 7
20.04.1827“,„nach 1872 (bei ∞ von AZ.14, noch lebend)“
„E h l e r, Josef, Gärtler“,„Deutsch-Markersdorf Nr. 20
28.03.1814“,"Deutsch-Markersdorf Nr.20 11.11.1899 (86 J.), ",„Briesau
07.02.1843“
„E r t e l t, Elisabeth“,„Groitsch Nr. 3
21.10.1820“,"Deutsch-Markersdorf Nr. 20 21.12.1852 (32 J.)

Da musst Du noch am Anfang und am Ende ein " einfügen und den Text mit
der Endung .csv sichern. Die Datei kannst Du dann in eine
Tabellenkalkulation einfügen und hast dann die einzelnen Werte je Person
in einer eigenen Spalte.
Es gibt (Genealogie-) Programme, die csv-Dateien importieren können und
daraus dann eine GEDCOM-Datei erzeugen.

Auf diesem Weg hast Du einen Haufen Tipparbeit gespart. Allerdings wirst
Du ganz viele Felder bekommen, die mehrere Einzeldaten in einem Feld
enthalten, weil man über die suchen/ersetzen-Funktion einige Daten nicht
trennen kann.
Du bekommst dann halt einen Nachnamen (oder Vornamen, je nach dem, wo Du
das einsetzen lässt):
G r o ß m a n n, Josef, Schuhmachermeister

Das musst Du dann im Genealogieprogramm händisch per ausschneiden und
einfügen trennen und passend zuordnen.
Dasselbe gilt für Geburtsort/-Datum etc.

Du kannst Dir also lediglich die Übernahme in ein Genealogieprogramm
etwas vereinfachen und musst nicht alles selber tippen. Die Hauptarbeit
wird die Aufteilung der Einzelbestandsteile sein.

Bezüglich des Nachnamens, der mit Leerzeichen gesperrt ist, brauchst Du
ein Genealogieprogramm, dass per suchen/ersetzen die Leerzeichen im
Nachnamen entfernen kann (meins kann das).

Frohes Schaffen.

Gruß, Stefan Mettenbrink.

Ich würde genauso vorgehen. Einen Bedarf für den Einsatz einer KI sehe ich hier nicht, da die Angaben recht gut strukturiert sind. Ich würde aber vor dem Import in ein Genealogieprogramm die Felder noch weiter auftrennen: Beruf abspalten (wenn zwei Komma im Namensfeld), Vor- und Nachnamen trennen, Sperrung im Nachnamen entfernen, Orts- von Datumsangaben trennen, …,

Man könnte ChatGPT verwenden um die regulären Ausdrücke zu entwerfen. Aber da eine Einarbeitung in die regulären Ausdrücke eh sein muss, wird das die Sache eher komplizierter als einfacher machen.

1 „Gefällt mir“

Können und wollen wir das hier leisten? Wir müssen ja das Rad nicht neu erfinden, es gibt sicherlich im Netz Anleitungen dazu, ob als Text oder auch Video.

Ich fange mal an mit Dr. Daniel Fett

https://danielfett.de/2006/03/20/regulaere-ausdruecke-tutorial/

to be continued?

1 „Gefällt mir“

Wie hier bereits angemerkt, liegen die zur Verfügung gestellten Daten der Ahnenliste in gut strukturierter Form vor. Eine Konvertierung „aller“ Daten in eine GEDCOM-Struktur erscheint daher möglich und wurde von mir testweise vorgenommen.

Dabei bin ich in 2 Schritten vorgegangen.

Im ersten Schritt habe ich mit einem individualisierten, eigengeschriebenen Programm die einzelnen Sätze der Word-Vorlage zerlegt und die einzelnen Bestandteile in eine tabellarische Form gebracht (Template.xlsx (11,7 KB)).

Im zweiten Schritt habe ich diese Tabelle mit Hilfe von GedTool über eine Mapping-Datei (Mapping DOC - GEDCOM 1.0.xlsx (10,0 KB)) in eine GEDCOM-Datei übertragen.

Das Ergebnis der Konvertierung kann im webtrees-Stammbaum Vladar - WordToGEDCOM – webtrees (genonline.de) betrachtet werden. Alle Daten wurden konvertiert und mit den entsprechenden GEDCOM-Kennzeichnungen versehen (Nachnamen ohne Leerzeichen, Rufnamen unterstrichen, Datumsangaben im GEDCOM-Format, Berücksichtigung von BEF und AFT, Angaben in Klammern als Notizen, Originaltext als Quellenangabe, …).

2 „Gefällt mir“

Hallo liebe Mitnutzer.innen, hallo lieber Herr Mettenbrink,

danke Stefan für die umfangreiche Antwort. Leider muss ich sagen, dass mich die mitgeschickte Aufstellung vor allem erschreckt. Sie wirkt so jedenfalls auf mich unübersichtlicher als meine nach Kekule erstellte Ahnenliste. Natürlich ist mir klar, dass sie für den erfahrenen Forscher Vorteile beim Verknüpfen bringt, aber mir geht es vor allem, dass auch andere evtl. meine Forschungsergebnisse möglichst einfach nutzen können.

Trotzdem: Ich werde es mir überlegen - muss aber zunächst nochmal den Schluss meiner Ahnenliste (XII., XIII. und evtl. XIV. Generation) gründlich überprüfen, dazu die Orts- und die Namensliste „auf Vordermann“ bringen. Also hab ich noch ein wenig Zeit.

Viele Grüße
Horst Vladar

Das Ergebnis von Stefan war ja nur ein Zwischenergebnis auf dem Weg zu einer GEDCOM Datei, die man dann in einem beliebigen Genealogieprogramm bearbeiten und präsentieren kann. Peter hat diesen Weg ja vollständig durchgeführt.

Ich schlage vor, die weiteren Arbeiten gleich in einem Genealogieprogramm zu machen und sofort umzusteigen. Das wird nach einer kurzen Einarbeitung sicher viel effizienter werden. Und es bietet mehr Sicherheit gegen Verlust der wertvollen Arbeit und ermöglicht die Zusammenarbeit mit anderen Forschern ab sofort.

Ich tippe auf ein Missverständnis.
Ich habe lediglich erklärt, wie man die Daten aus der Word-Datei in eine
Tabellenform umstrukturiert. Die Daten kann man dann in ein
GEDCOM-Programm importieren, welches daraus verschiedene Darstellungen
generieren kann.
Die sind dann auch übersichtlicher.

Beispiele:

etc.

Meine Beschreibung sollte nur helfen, die mühselige Abtipperei zu
minimieren.

Gruß, Stefan Mettenbrink.

Nochmals danke. Nach meinem Urlaub werde ich mich mal „vertiefen“.
Grüße
Horst Vladar