Excel - GEDCOM

Hallo Dirk,

die Aussage mit "nahezu verlustfrei" ist nicht f�r jeden tragbar. Sorry! :-[
(wo sind die Verluste? W�re gut wenn diese bekannt w�ren)

Der Im- und Export in Ahnenblatt funktioniert wie von Dir angek�ndigt. *prima* :slight_smile:

Das Problem ist nur bei einer manuellen Eingabe in Excel wird meistens die Familienstruktur nicht so eingegeben wie diese f�r Gedcom ben�tigt wird (Familiennummern etc.). :frowning:
Somit kann dann meistens auch nur Einzelpersonen in eine Gedcomdatei verwandelt werden (wie von mir angesprochen).

Mach weiter so. Du hast wieder einen gro�en Wurf mit der Weiterentwicklung von "Ahnenblatt" gemacht. :slight_smile:

Sch�ne Forschergr��e

Heinz (K�hler)

Hallo, Heinz!

die Aussage mit "nahezu verlustfrei" ist nicht f�r jeden tragbar. Sorry! :-[

Und doppelte Mails in einer Mailingliste sind auch nicht f�r jeden tragbar. Sorry! :wink:

(wo sind die Verluste? W�re gut wenn diese bekannt w�ren)

Die sind eher unbedeutend, wollte aber nicht "verlustfrei" schreiben, weil mir dann u.U. auch jemand das Gegenteil nachweist ... :wink:

Es ging (zur Erinnerung) um die "Verluste", wenn man Familiendaten (Ahnenblattformat oder Gedcom) mittels Ahnenblatt als CSV-Datei abspeichert und danach die CSV-Datei wieder mit Ahnenblatt einliest.

Zum einen gehen die Angaben des Erstellers (inkl. Adresse) der Datei (ist �brigens eine im Gedcom-Standard zwingend erforderliche Information) verloren.

Des weiteren werden Zeilenumbr�che (in Notizen und Quellangaben) durche ", " ersetzt, da das CSV-Format (weil zeilenorientiert) nicht mit "au�erplanm��igen" Zeilenumbr�chen umgehen kann (und w�rde daraus unvollst�ndige, neue Datens�tze lesen).

Weiterhin werden in allen Texten doppelte Anf�hrungszeichen (") durch einfache Anf�hrungszeichen (') ersetzt, da in der resultierenden CSV-Datei die Textfelder durch doppelte Anf�hrungszeichen eingerahmt sind.

Der Im- und Export in Ahnenblatt funktioniert wie von Dir angek�ndigt. *prima* :slight_smile:

Freut mich zu h�ren.

Das Problem ist nur bei einer manuellen Eingabe in Excel wird meistens die Familienstruktur nicht so eingegeben wie diese f�r Gedcom ben�tigt wird (Familiennummern etc.). :frowning:
Somit kann dann meistens auch nur Einzelpersonen in eine Gedcomdatei verwandelt werden (wie von mir angesprochen).

Ich habe bei der Konzeption des CSV-Formats versucht diesen Punkt so gut es geht zu ber�cksichtigen. Gedcom-interne Nummerierungen f�r Personen und Familien m�ssen dabei nicht zwingend vorkommen.

Ich versuche es mal an einem Beispiel zu zeigen (ich hoffe es klappt).
Bitte die folgenden f�nf Zeilen (wenn Zeilenumbr�che entstehen, m�ssten die manuell entfernt werden) in einen Texteditor kopieren und das ganze als z.B. "Test.csv" speichern.

"NAME";"FATH.NAME";"MOTH.NAME";"BIRT.DATE";"DEAT.DATE";"MARR.DATE.1";"MARR.SPOU.NAME.1"
"Gregor Beckmann";"Josef Beckmann";"Regina Willner";;;;
"Josef Beckmann";"Robert Beckmann";"Josefine Koch";15.04.1929;21.06.1999;01.10.1953;"Regina Willner"
"Karl Beckmann";"Josef Beckmann";"Regina Willner";03.05.1955;;07.09.1985;"Roswitha T�ufer"
"Regina Willner";"Hermann Willner";"Johanna Sch�pken";13.02.1931;;01.10.1953;"Josef Beckmann"

Wenn man diese CSV-Datei dann mit Ahnenblatt �ffnet, entsteht ein Ehepaar mit zwei Kindern (inkl. Personenverkn�pfungen!).

Dass die �berschriftenzeile so keiner verwenden w�rde, ist mir schon klar. Das ist der einzige Punkt, den man als Anwender manuell nachbearbeiten muss (da hilft die Programmhilfe ein wenig).

Mach weiter so. Du hast wieder einen gro�en Wurf mit der Weiterentwicklung von "Ahnenblatt" gemacht. :slight_smile:

Das h�rt man doch gerne ... :wink:

Gru�, Dirk.

Dirk Böttcher wrote:

Des weiteren werden Zeilenumbrüche (in Notizen und Quellangaben) durche ", " ersetzt, da das CSV-Format (weil zeilenorientiert) nicht mit "außerplanmäßigen" Zeilenumbrüchen umgehen kann (und würde daraus unvollständige, neue Datensätze lesen).

Hier würde ich empfehlen, etwas selteneres zu benutzen, dann kann man das über suchen/ersetzen automatisch zurückwandeln (z.B. "[CR]").

Weiterhin werden in allen Texten doppelte Anführungszeichen (") durch einfache Anführungszeichen (') ersetzt, da in der resultierenden CSV-Datei die Textfelder durch doppelte Anführungszeichen eingerahmt sind.

Ich kenne mich leider nicht mit Excel aus (und habe auch kein Excel zum nachsehen), aber war es nicht so, dass Excel die Daten in " setzt und durch Komma trennt? Somit hast Du am Anfang und am Ende einer Zeile ein " und dazwischen jeweils "," als Trennung. Also nicht einfach nur "".
Kann man das nicht auch in Excel einstellen?

Ach so, noch etwas zu Zeilenumbrüchen in Bemerkungen. Wie exportiert Excel die denn? Wenden die auch in irgendetwas umgewandelt? In was?

"NAME";"FATH.NAME";"MOTH.NAME";"BIRT.DATE";"DEAT.DATE";"MARR.DATE.1";"MARR.SPOU.NAME.1"

Die Verknüpfungen gehen nur über die Namen? Was ist, wenn dieser Name doppelt vorkommt?

MfG, Metti.

Hallo, Metti!

Des weiteren werden Zeilenumbr�che (in Notizen und Quellangaben) durche ", " ersetzt, da das CSV-Format (weil zeilenorientiert) nicht mit "au�erplanm��igen" Zeilenumbr�chen umgehen kann (und w�rde daraus unvollst�ndige, neue Datens�tze lesen).

Hier w�rde ich empfehlen, etwas selteneres zu benutzen, dann kann man das �ber suchen/ersetzen automatisch zur�ckwandeln (z.B. "[CR]").

K�nnte man machen, allerdings w�rde das mit dem Suchen und Ersetzen in Ahnenblatt nicht funktionieren. Ein Zeilenumbruch l�sst sich nicht als Ersetzungstext eingeben.

Weiterhin werden in allen Texten doppelte Anf�hrungszeichen (") durch einfache Anf�hrungszeichen (') ersetzt, da in der resultierenden CSV-Datei die Textfelder durch doppelte Anf�hrungszeichen eingerahmt sind.

Ich kenne mich leider nicht mit Excel aus (und habe auch kein Excel zum nachsehen), aber war es nicht so, dass Excel die Daten in " setzt und durch Komma trennt?

Bei Textfeldern wird das so gehandhabt. Bei reinen Zahlen-/Datumsfeldern l�sst Excel diese aber auch weg.

Somit hast Du am Anfang und am Ende einer Zeile ein " und dazwischen jeweils "," als Trennung.

Zwar nicht am Anfang/Ende einer Zeile, aber am Anfang/Ende eines Datenfeldes.

Also nicht einfach nur "".

Hat auch keiner behauptet, oder?

Kann man das nicht auch in Excel einstellen?

�hh ... Was soll man einstellen ...?

Ach so, noch etwas zu Zeilenumbr�chen in Bemerkungen. Wie exportiert Excel die denn? Wenden die auch in irgendetwas umgewandelt? In was?

Ich habe ehrlich gesagt auch kein Excel zur Hand ...
OpenOffice macht daraus ein "Character 10" Zeichen (erscheint in Notepad als K�stchen). Wird beim Reimport auch wieder korrekt behandelt.

Interessant w�re auch, was eine MacOS-Tabellenkalkulation in solchen F�llen macht. Da besteht im Gegensatz zu Windows meines Wissens jeder Zeilenumbruch generell nur aus einem Zeichen (n�mlich besagtem "Character 10").

Ich m�sste woanders noch mal schauen, was Excel in diesem Fall macht.

"NAME";"FATH.NAME";"MOTH.NAME";"BIRT.DATE";"DEAT.DATE";"MARR.DATE.1";"MARR.SPOU.NAME.1"

Die Verkn�pfungen gehen nur �ber die Namen?

Nein, dem ist nicht so. Man kann auch eindeutige IDs (beliebige Textkombinationen) verwenden.
Es wurde nur von Heinz angemerkt, dass wohl keiner bei einer manuellen Pflege seiner Datein in einer Tabellenkalkulation so etwas wie "Familiennummern" (analog Personen-IDs) vorsehen w�rde und damit in solchen F�llen immer nur "Einzelpersonen" entstehen w�rden.
Dieses kleine Beispiel sollte nur eine m�gliche Arbeitsweise mit Ahnenblatt zeigen und somit die Aussage von Heinz wiederlegen.

Was ist, wenn dieser Name doppelt vorkommt?

Dann gibt es keine Eindeutigkeit mehr und die Verbindung zwischen den Personen wird nicht automatisch hergestellt (muss man dann in Ahnenblatt manuell machen).

Gru�, Dirk.

Hallo, Heinz!

(wo sind die Verluste? W�re gut wenn diese bekannt w�ren)

Eine Sache ist mir doch noch aufgefallen, die beim CSV-Export aus Ahnenblatt verloren geht ...

Bild- und Dateianh�nge samt zugeh�rigem Bermerkungstext werden nicht abgespeichert.

Gru�, Dirk.

Dirk Böttcher wrote:

Könnte man machen, allerdings würde das mit dem Suchen und Ersetzen in Ahnenblatt nicht funktionieren. Ein Zeilenumbruch lässt sich nicht als Ersetzungstext eingeben.

Da möglicherweise (noch ;-)) nicht, aber in Excel möglicherweise oder in einem anderen Programm, dass die exportieren Daten erhalten soll.

Ich kenne mich leider nicht mit Excel aus (und habe auch kein Excel zum nachsehen), aber war es nicht so, dass Excel die Daten in " setzt und durch Komma trennt?

Bei Textfeldern wird das so gehandhabt. Bei reinen Zahlen-/Datumsfeldern lässt Excel diese aber auch weg.

Kann man das nicht so einstellen, dass das für alle Felder gilt? Wäre blöd.

Also nicht einfach nur "".

Hat auch keiner behauptet, oder?

Mag sein, dass ich Deine Aussage: "Weiterhin werden in allen Texten doppelte Anführungszeichen (") durch einfache Anführungszeichen (') ersetzt, da in der resultierenden CSV-Datei die Textfelder durch doppelte Anführungszeichen eingerahmt sind."
falsch interpretiert habe. Ich kenne mich kaum mit Excel aus.

Kann man das nicht auch in Excel einstellen?

Ähh ... Was soll man einstellen ...?

Ich meine die/das Zeichen, dass die Tabellenspalten in Excel bei einem CSV-Export voneinander trennt. Wie Du oben schon geschrieben hast, werden manchmal die Tabellenfelder in Anführung gesetzt, manchmal nicht. Ich finde das nicht sonderlich geschickt.

Wenn man einstellen kann, dass immer alle Fleder in Anführungen (genaugenommen Zoll-Zeichen) stehen und durch Komma getrennt sind, hat man weniger Probelem mit " in den Feldern.

Ich habe ehrlich gesagt auch kein Excel zur Hand ...
OpenOffice macht daraus ein "Character 10" Zeichen (erscheint in Notepad als Kästchen). Wird beim Reimport auch wieder korrekt behandelt.

Interessant wäre auch, was eine MacOS-Tabellenkalkulation in solchen Fällen macht. Da besteht im Gegensatz zu Windows meines Wissens jeder Zeilenumbruch generell nur aus einem Zeichen (nämlich besagtem "Character 10").

Kann ich jetzt auch nicht genau sagen. Generell ist "Character 10" (&h0A) ein LineFeed (LF), ein &h0D ein CarriageReturn (CR). Nun handhaben Windows Mac OS und Linux das alle unterschiedlich. Ob das auch für die Anwendungen unter den entsprechenden Betriebssystemebn gilt weiß ich nicht. Wenn Excel unter Windows und Mac OS nur LF einfügt, kann man damit umgehen. Oder man muss zuvor alle CR ggf. entfernen.

Dieses kleine Beispiel sollte nur eine mögliche Arbeitsweise mit Ahnenblatt zeigen und somit die Aussage von Heinz wiederlegen.

Ach so, hatte mich schon gewundert, wie das ohne eindeutige Nummern gehen soll.

MfG, Metti.

Hallo Metti,

mit Excel kannst Du alles suchen und durch alles ersetzen.
Auch chr10 oder chr13, und alle Anf�hrungszeichen sowieso.
Und wenn Du's komfortabel magst, kannst Du alles per VBA machen.

Selbstverst�ndlich kann man sowohl INDI's als auch FAM's erfassen und wie bei Gedcom �ber die @###@ verkn�pfen.

Gruss, Markus

Markus Bärlocher wrote:

mit Excel kannst Du alles suchen und durch alles ersetzen.
Auch chr10 oder chr13, und alle Anführungszeichen sowieso.
Und wenn Du's komfortabel magst, kannst Du alles per VBA machen.

Selbstverständlich kann man sowohl INDI's als auch FAM's erfassen und wie bei Gedcom über die @###@ verknüpfen.

Ich hatte von einem solchen Programm auch nichts anderes erwartet :wink:

Der Hinweis ist aber beser an Dirk gerichtet, da sein CSV-Export die Zeilenumbrüche der Bemerkungen in etwas wandelt, was dann automatisch nicht wieder zurückgewandelt werden kann.

BTW, was macht Excel denn auch Zeilenumbrüchen innerhalb von Feldern, wenn man die Tabelle als CSV exportiert?

MfG, Metti.