Fehler in der DES-Suche?

Hallo,
beim erfassen im AB Stolp wurden auf einer Seite entgegen den Regeln
alle Daten erfasst, anstelle von nur die Hausbesitzer.
Wir haben deshalb alle Daten gelöscht und anschließend nur die relevanten Daten erfasst.
https://des.genealogy.net/stolp1931/scans/StrVz-214

Bei der Suche nach Daten in der z.B. Goldstraße 12 werden auch nach Tagen
die gelöschten plus neu erfassten Daten angezeigt.
https://des.genealogy.net/stolp1931/search?lastname=&firstname=&value01=&value02=goldstraße+12&value03=&value04=&value05=&value06=&value07=&value08=&value09=&value10=&value11=&pageValue01=&pageName=&search=Suchen


Klicke ich nun auf einen gelöschten Eintrag erscheint der Hinweis

Wer kann helfen?
Gruß Joachim

Da könnte es sein, dass bei gelöschten Datensätzen keine Synchronisation mit dem Suchserver erfolgt.

Da ein solches Verhalten für Suchende nicht hilfreich ist und auch kein gutes Licht auf das DES wirft, sollte hier nachgebessert werden.

Als Sofortmaßnahme (bzw. ohnehin in regelmäßigen Abständen) sollte der Suchserver neu indexiert werden.

Herzliche Grüße (heute noch aus Krakau)

Susanne

Wie habt ihr das gemacht?

Klicke ich nun auf einen gelöschten Eintrag erscheint der Hinweis

Das kann ich nicht nachvollziehen.

Das wäre eine schlechte Sofortmaßnahme, denn damit wäre das System stundenlang, wenn nicht tagelang nicht zu gebrauchen.

von der Seite
https://des.genealogy.net/stolp1931/scans/StrVz-214
sind wir auf Seitendetails gegangen
https://des.genealogy.net/page/details/1478628
Dort haben die alle Einträge dieser Seite gelöscht
image
und anschließend nur die relevanten Daten neu erfasst.

Das hatten wir doch ganz oft bei dem Hochschulschriften-Projekt. Wie Susanne sagt sind das ausbleibende Synchronisierungen. Hintergründe unter https://discourse.genealogy.net/t/wann-aktualisiert-sich-der-index/825200

Das verstehe ich wiederum nicht.
Welches System ist dann aus welchem Grund nicht zu gebrauchen?

Kannst Du bitte hier mal beschreiben, was bei einer neuen Indexierung des Suchservers im Hintergrund passiert?

Wir haben mit dem DES bisher gut 27 Millionen Datensätze in zahlreichen Projekten erfasst.
Jede Nacht zu einer ruhigen Uhrzeit davon in einem rollierenden System jeweils 1 Million neu indexiert, dann wären alle entstehenden Inkonsistenzen - in allen Projekten - nach maximal einem Monat beseitigt.

Sonst müssen wir einen anderen Weg suchen und finden, wie wir Inkonsistenzen zwischen der DES-Datenbank und dem Suchserver (der dann falsche Suchergebnisse erzeugt) verhindern können. (z. B. wie ganz zu Anfang der DES-Erfassung ausführliche Log-Funktionen über Änderungen, die dann in regelmäßigen Abständen mit dem Suchserver abgeglichen und dieser aktualisiert wird) - Nur so als Gedanke.

Herzliche Grüße,

Susanne

Und genau dort steht, was passiert, wenn bei der Suche ein Eintrag gefunden wird, den es in der Datenbank nicht mehr gibt. Es gibt keine Fehlermeldung, sondern der Eintrag wird im Suchserver gelöscht. Damit wurde dieser Eintrag automatisch wieder „synchronisiert“. Dass es eine Fehlermeldung gibt, kann ich nicht nachvollziehen. Es wäre gut, wenn ich genau die Adresse, die zu dem Fehler führt, bekommen könnte.

Möglicherweise ist diese Massenlöschung die Lücke, bei der Einträge im Suchserver verbleiben. Ich habe das als Prüfen, ob bei "Alle Einträge dieser Seite löschen" auch im Suchserver gelöscht wird (#438) · Issues · project / des · GitLab notiert.

Vielen Dank.
Nun sind nur die neu erfassten Daten in der Suche.`

Genau das hätte ich als nächstes hier angesprochen, wäre mir Jesper nicht zuvor gekommen.

Demnach scheint Joachims konkretes Problem gelöst zu sein.
Allerdings rückwirkend, also nicht über eine Ergänzung in der Programmierung, die noch nicht umgesetzt ist und dann auch nur für zukünftige seitenweise Löschungen gilt.

Gehe ich recht in der Annahme, dass das konkrete (von der Menge her überschaubare) Projekt noch einmal neu indexiert wurde?

Herzliche Grüße,

Susanne

@jzedlitz kannst Du diese Frage bitte beantworten?

Entweder mit Ja oder mit einer Beschreibung, was stattdessen gemacht wurde, da der Suchindex für das konkrete Beispiel Adressbuch Stolp 1931 nun korrekte Ergebnisse zeigt.

Hintergrund der Frage ist das Thema Export, denn laut der heute hier geposteten Links, speist sich der Export aus dem Suchindex.

Angenommen, der Suchindex ist nicht aktuell, dann ist in der Folge auch der Export nicht aktuell.
Das scheint mir nicht der richtige Weg für eine Nachnutzung zu sein.

Oder umgekehrt: Vor einem Export des Datensatzes zu einem Projekt müsste konsequenter Weise der Suchindex aktualisiert werden, um für den Export einen aktuellen Stand zu haben.

Das kannst aber nur Du, Jesper … oder?

Mit nachdenklichen Grüßen,

Susanne

Nein, es wurde nicht neu indexiert. Wie ich schon geschrieben habe, hat das DES „Selbstheilungskräfte“.

Der Export speist sich nicht aus dem Suchindex. Das wurde vor etwas einem Jahr geändert (Commit 9d03cab4).

Was darf man unter „Selbstheilungskräften“ verstehen?

Meinst Du das, was Du schon geschrieben hast?

Das würde dann bedeuten, dass eine Reparatur erst erfolgt, nachdem der Fehler entdeckt wurde. Der zuerst Suchende erhält also ein falsches Ergebnis.

Und im konkreten Fall hat das Ergebnis, das dem zuerst Suchenden @Joachim_Buchholz angezeigt wurde dazu geführt, dass er dieses Thema gestartet hatte.

Wäre hier statt einer nachgelagerten Reparatur nicht eine vorgelagerte eine genauere Überlegung wert?

Herzliche Grüße,

Susanne