Open Access oder Protektionismus

Was wäre mit der https://db-brandenburg.de/

Jetzt bin ich gespannt ob wir. den @norbert_n-henkel.de erreichen.

@Renate_CG hat sich für die Printredaktion ja schon gemeldet. Ich rufe mir jetzt noch den Günter @Junkers und vielleicht auch noch die Tanja @tbals.compgen herbei?

Es melden sich in Abständen auch immer wieder Menschen, die beruflich Anleitungen verfassen.
Bitte meldet Euch.

Diesen Gedanken kann ich gut mit Dir teilen. Es ändert aber erst einmal nichts.
Die „Macher“ aus den Vereinen müssten sich jetzt melden.

Wir sind keine Konkurrenten!

Wir müssen uns besser untereinander vernetzen!

@Bernhard.Mosolf

Wir müssen uns besser untereinander vernetzen!

Um diesen, deinen Gedanken einmal aufzugreifen und weiter zu denken:

Die 4. industrielle Revolution hat die Vernetzung von Daten zum Antrieb und Inhalt. Deshalb stelle ich einmal die Frage in die Runde: Muss eine Metasuche zentral organisiert sein? Soll heissen: Es gibt eine zentrale Webseite an der ich eine bestimmte Anzahl angeschlosseneer Clients abfragen kann?

Wenn man den Gedanken einmal weiter denkt, könnte extakt die gleiche technische Spezifikation auch eine Lösung ermöglichen, bei der die Datenbanken der Vereine untereinander abfragbar werden, ohne dass man den Datenbestand der anderen Vereine kennen muss, sondern ausschließlich über die REST-Abrage Schnittstelle, wenn sie enstprechend definiert/spezifiziert ist.

Das würde ein Netzwerk untereinander verbundener Vereine bilden, deren Daten vielleicht nur den Mitgliedern der Vereine unterienander oder (hoffentlich) im Open Access zur Verfügung stehen… immer mit dem Hinweis darauf, wo die Datenquelle sich befindet. Die genealogische Metasuche wandelt sich so zu einer netzartigen Topologie unterschiedlicher Datenanbieter. Damit werden Konzept möglich, dass benachbarte Vereine, Vereine mit einem regional ähnlichen Forschungsgebiet aber auch private Anbieter (wie wir vom NamensIndex) ihre Daten untereinander tauschen könne, ohne sie als Bestand herausgeben zu müssen. Auch das fördert den Weg hin zum Open-Access. Dem Familienfoscher bietet es den Vorteil, dass er nicht ständig hunderte von einzelnen Inseldatenbanken abfragen muss. Jede Metasuchstelle im Netz hat die selben Ergebisdaten zu Verfügung. Dann wäre es egal ob ich die Metasuche bei Verein Compgen oder Verein XY abfrage.

Ist das zu revolutionär gedacht :shushing_face:? Es bevorteilt sich kein Verein im einzelnen… aber der „Schwarm“ bietet allen einen Mehrwert. Gehört dazu auch die DAGV befragt?

Bei einem solchen gesellschaftlichen Wandel in der Familienforschung muss Compgen als Kompetenzgeber eine führende Rolle einnehmen… aber dieser Prozess wird sicherlich über die kommenden Jahre hinweg zu beschreiten sein.

just my humble opinion,
Clemens

1 „Gefällt mir“

@jzedlitz:
Das können wir gerne machen. Ich fürchte zwar, es wird eine Zwei-Mann-Arbeitsgruppe, aber auch da können wir ja etwas Gescheites auf die Beine stellen.

Es wäre ein guter Anfang!
Gibt es im GitLab bereits Repositories, die weiterführenden technischen Inhalt zur REST-API der „Metasuche“ beisteuern? Ich konnte mit meinem Account nichts finden. Zum GOV-Client gibt es vergleichbares.

@Georg.Fertig:
Mir scheint das sehr sinnvoll. Ist das etwas, das man beauftragt, oder müssen wir das selbst machen? Eine Arbeitsgruppe könnte durchaus das Mandat bekommen, das als extern zu vergebenden Auftrag zu gestalten.

Für eine reine konzeptionelle Spezifikation zur Ergänzung der API benötigt es keine externe Hilfe. Ich denke das wird @jzedlitz ähnlich sehen. Wenn man dann irgendwann das „Große Ganze“ (siehe meinen Beitrag von 10:37) angeht, halte ich den Projektgedanken sogar für öffentlich förderungswürdig, wenn man nicht nur Vereine sondern auch öffentliche Stelle (z.B. Archive, Bibliotheken, …) in den Kontext mit einbezieht. Das liegt vorerst noch in etwas weiterer Ferne und bedarf keiner dringenden Aktion.

Viele Grüße,
Clemens

Wohin möchtest Du gehen?

Was möchtest Du da Fragen? Und vor allem wen möchtest Du Fragen?

Ich versuche jetzt zu verstehen, was Dir da vorschwebt bzw. was ich davon schon in der Mache sehe.

Nicht erst seit diesem Artikel hier

sucht CompGen nach einer Lösung.

Die hier maßgeblichen Begriffe lauten wohl wikidate und wikibase

Und jetzt kommt die Suche auf discourse ins Spiel. :wink:

Suchergebnisse für „wikidata“ - genealogy.net oder Suchergebnisse für „wikibase“ - genealogy.net.

@Clemens_Draschba , wäre das für Dich ein Weg?

@Bernhard.Mosolf :
Die hier maßgeblichen Begriffe lauten wohl wikidate und wikibase

Ich sehe jetzt keinen Zusammenhang zwischen „wikidate“, „wikibase“ und einer besseren Vernetzung genealogischer Daten zwischen den Vereinen und Datenanbietern. Es sei denn, man möchte zukünftig alles in eine einzelne Wiki-Instanz packen… was genau das Gegenteil einer verteilten Vernetzung von Daten wäre.

wikidate und wikibase sind spannende Technologien für Compgen, führen aber nicht zwangsläufig zu einer verbesserten Kooperation und Vernetzung mit anderen Vereinen, die eben nicht auf diese Technologie setzen.

1 „Gefällt mir“

Dann entwickel Deinen Gedanken bitte weiter.

Ich verfolge den interessanten Ansatz von @Clemens_Draschba und möchte mal die aus den Anfängen des WWW entwickelte Suchmaschine MetaGer ins Spiel bringen. Das dürfte dem angedachten Ansatz sehr Nahe kommen, zumal diese Suchmaschine ihren Quellcode unter GNU AGPL-Lizenz veröffentlicht https://metager.de/about.

1 „Gefällt mir“

Die Tanja muss mal auf die Suche gehen, warum sie hier gar keine Benachrichtigung erhalten hat.

Ich denke, weil ich den Mailinglistenmodus mit diesem Account nutze und außer die Kategorie News-Redaktion hier alles stummgeschaltet habe, bekomme ich keine Benachrichtigung, wenn man mich mit diesem Account markiert.

Redaktionsschluss für die CG 1 wäre Ende Januar, also jetzt bald.
Wenn das jemand verlässlich bis Ende Januar schreiben kann, dann können wir gerne darüber reden :slight_smile:
Eine Rückmeldung bitte per PN an mich, sonst bekomme ich das wieder nicht mit.

[tbals.compgen] tbals.compgen
https://discourse.genealogy.net/u/tbals.compgen
16. Januar

Redaktionsschluss für die CG 1 wäre Ende Januar, also jetzt bald.

Moooment - die CG ist verplant, wenn ich das richtig sehe. Also lieber
keine Schnellschüsse, sondern die CG 2 ins Auge fassen.

Schöne Grüße,
Renate

Ich habe Tanja bereits per PN geantwortet und darum gebeten, dass das Thema erst einmal weiter zu durchdenken sei, bevor unausgegohrene Eier gelegt werden. Inzwischen habe ich von Jesper auch Zugang zur Swagger-Definition der Schnittstelle zur Metasuche erhalten. Also auch hier geht es technisch voran.

Viele Grüße,
Clemens

Und zum Vernetzen?

@Bernhard.Mosolf
Und zum Vernetzen?

Ich verstehe deine Frage nicht. Eine REST-Schnittstelle ist die Definition der Vernetzung von Kommunikationspartnern im Internet.

Warte mal, ich zitiere Dich

Offensichtlich nicht. Ich habe es nicht auf Anhieb verstanden.

Jetzt, nachdem ich mich informiert habe, bekomme ich die Spur einer Ahnung zur Dimension.

Frage: Die Teilnahme der Systeme lässt sich steuern? Über z.B. einen Schlüssel?

Anders gefragt: Würdest Du rein kommerzielle Systeme teilhaben lassen oder ausschließen?

Bedingungen setzen?

Bis denne…
Bernhard

Mal wieder zurück zum eigentlichen Thema „Open Access“ bzw. „Open Data“ (vielleicht lässt sich der Exkurs zur Metasuche noch vorsichtig abtrennen).

Bei „Open Data“ haben wir in der Genealogie eine Besonderheit, die in der Form möglicherweise einzigartig, zumindest selten ist: wir haben es mit einem Markt zu tun, auf dem es auf dem es einige sehr große, finanzstarke kommerzielle Anbieter gibt, die auch vor „unsauberen“ Datenübernahmen (Stichwort Bremer Passagierlisten) nicht zurückschrecken. Würden wir unsere hochwertigen Daten (insbesondere die großen flächendeckenden Datenbestände) nun als „Open Data“ zum Download bereitstellen, würden sie vermutlich sofort von diesen Anbietern übernommen.

Darüber wären unsere freiwilligen Mithelfer:innen bestimmt not amused. Selbst wenn wir eine Nennung von CompGen (und anderen Vereinen) verlangen könnten, so wäre es doch sehr zweifelhaft, ob die Kundengruppe das überhaupt mitbekommt. Die Daten kommen aus ihrer Sicht einfach vom großen Anbieter und es lohnt sich augenscheinlich wirklich, dafür Geld auszugeben.

Aus dem Grund sind wir übrigens bei Coding da Vinci Ost³ nur mit Auszügen der Verlustlisten des 1. Weltkriegs dabei.

2 „Gefällt mir“

Da stimme ich Dir zu!

Ich hatte zuvor gefragt

Da wäre dann also eine Lizenz zu wählen, die kommerzielle Nutzung draußen vor lässt.

Ich würde mich jetzt mal über mehr Beteiligung freuen. Zuspruch oder Ablehnung oder neue Gedanken.

Gespannt
Bernhard

Moin @jzedlitz, der Aspekt, den du hier zu bedenken gibst ist ganz richtig. Wer seine „Open-Data“ allzu leichtfertig zugänglich als Download anbietet muss damit rechnen, dass kommerzielle oder andere Datensammler dieses Angebot auch wahrnehmen. Ob hiergegen eine speziell verfasste Lizenz schützen kann vermag ich als Nicht-Jurist nicht treffsicher zu beurteilen.

Ich würde auch nie auf die Idee kommen große, wertvolle Datenbestände einfach so als Komplettbestand downloadbar zu machen, um dies dann als Open-Data zu bezeichnen. Viel spannender ist doch die Frage danach, wie man die aktuell durch einen einzelnen Familienforscher aktuell gesuchte und für seine Arbeit benötigte und begrenzte Teilmenge eines Datenbestandes zur Verfügung stellen kann und wie und wo er an die von ihm benötigten Daten gelangt.

Dein Hinweis wirft einen ganz neuen Aspekt zum „Protektionismus“ auf: Wie schütze ich als Anbieter meine umfangreichen Datenbestand gegen unlauteren Missbrauch. Hinter professionell implementierten Bezahlschranken sind die Datennutzer jederzeit identifizierbar. Beim Open-Data-Download-Angebot ganz sicher nicht. Für eine Vernetzung von nachgefragten Teildatenbeständen eines Einzelnutzers können in der Tat Schlüssel eine technische Absicherung gewähren. Ebenso können sie auch in einer vernetzten Datenschnittstelle zwischen unterschiedlichen Datenbankbetreibern einen Schutz darstellen: (API-Keys, Session-Key, Authentification für REST-Teilnehmer, Captchas,…). Wir haben im Namensindex auch mit einer Reihe unterschiedlicher Methoden Vorkehrungen gegen allzu plumpes Data-Harvesting getroffen.

Zu bendenken gilt jedoch, dass jemand der einen Datenbestand über das Internet versucht abzuernten immer auch nur einen tagesaktuellen Snapshot erhält, sofern er nicht in regelmäßigen Abständen diese „Ernte“ wiederholt, um auch Ergänzungen, Korrekturen oder Updates „mitzunehmen“. Dies mag für indexierte Daten eine Rolle spielen, deren Bestand fortlaufend aktualisiert wird.

Protektionismus sollten wir also in zwei Facetten getrent voneineander betrachten: Der legitime Schutz eines Gesamtdatenbestandes gegen „missbräuchlichen Abgriff“ versus Schutz einer angefragten kleinen Teilmenge des Datenbestandes, um damit Open-Access-behindernde Ziele zu verfolgen… z.B. die vielfach gerügte „Bezahlschranke“.

Die Compgen Metasuche beinhaltet übrigens mit seiner Empfehlung „liefere max. 20 Ergebisse“ aus der Suchanfrage bereits einen solchen Schutz gegen das übermäßige Data-Harvesting.

Viele Grüße,
Clemens

Dagegen kann man sich zur Wehr setzen. Wenn wir dergleichen entdecken machen wir es öffentlich.

Und in jede Datenbank kann man Kontroll-Einträge unterbringen. Es muss ja nicht gleich die

image

sein.

Bis denne…

Bernhard

1 „Gefällt mir“