Alle Seiten einer Kategorie erhalten

Hallo,

wie bekommt man alle Seiten einer Kategorie aus dem GenWiki so das man sie in eine Tabellenkalkulation einfügen kann?

Gerhard (Stoll)

Hallo Gerhard,

das kann man hilfsweise erreichen, indem man in der Kategorie alle Artikel markiert und diese dann per Copy&Paste in die Tabellenkalkulation (bei mir LibreOFfice Calc) einfügt. Etwas Nacharbeit ist dann noch erforderlich.

Viel Erfolg

Werner (Rost)

Hallo Gerhard,

das klappt ganz gut mit dem pywikibot-Framework (vgl. GitHub - wikimedia/pywikibot: A Python library that interfaces with the MediaWiki API. This is a mirror from gerrit.wikimedia.org. Do not submit any patches here. See https://www.mediawiki.org/wiki/Developer_account for contributing. oder auch die Adaption fürs GenWiki genwiki / Wikibots · GitLab).

Beispiel: $ pwb.py listpages -config:user-config-prod.py -catr:Ort_in_Niedersachsen -format:3 um alle Artikelnamen aus der „Kategorie:Orte in Niedersachsen“ und den untergeordneten Kategorien zu erhalten.
Details siehe: Non editing scripts - Pywikibot 8.3.2 documentation

Kann es bei Bedarf auch gern erledigen.

LG Bernd

Hallo Werner,

Ist aber nur sinnvoll, wenn es weniger als 200 Einträge sind. Bei mehr wird es hässlich. Oder kann man der URL noch irgendwelche Schlüsselworte mit geben die man so aktuell nicht sieht?

Gerhard (Stoll)

Hallo Gerhard,

eine URL-Erweiterung sehe ich nicht.

Aber Bernd hat ja einige Hinweise gegeben.

Werner

Mit weniger Einstiegshürden und ohne zusätzliche Installationen kann man auch passable Ergebnisse erzielen mit Spezialseiten > API-Spielwiese (wird letztlich durch die Automatisierungslösungen wie pywikibot genutzt).

Einfach mal folgende URL
https://wiki.genealogy.net/Spezial:ApiSandbox#action=query&format=xml&list=categorymembers&cmtitle=Kategorie%3AOrt%20in%20Niedersachsen&cmcontinue=&cmlimit=500a
in die Adresszeile eintragen und den Ausführen-Knopf in der API-Spielwiese – GenWiki klicken.

Leider erhält man die Ergebnisse nur seitenweise (hier mit jeweils 500 Einträgen) präsentiert, so dass man dann ggf. noch munter den Aufruf mit dem entsprechend aus dem vorhergehenden Aufruf stammenden cmcontinue-Parameter wiederholen muss. Auch ist das Ergebnis NICHT rekursiv und man muss den Text noch mit einem Editor vom überflüssigen Drumherum befreien. Bei kleineren Ergebnismengen sicherlich eine Alternative.

LG
Bernd

Hallo Bernd,

Wäre nett, mit den Sachen komme ich nicht klar. Ich bräuchte das für " Kategorie:Adressbuch"

Ich hatte es auch mal die https://wiki.genealogy.net/Spezial:Exportieren versucht zu nutzen. Nur kommen dann max 5000 Zeilen in die Box.

Bezüglich des Austausch der Daten müssen wir noch einen Weg finden. Leider übersteigt es wohl auch hier meine Fähigkeiten Dir über Discourse einen PM zu schicken.

Gerhard (Stoll)

Zum Datenaustausch: Daten in eine Cloud stellen (z.B. dropbox), dort einen Link erzeugen und diesen Link dann posten.

Viel Erfolg
Werner

Hallo Gerhard,

habe drei Textdateien bereitgestellt unter: MagentaCLOUD

Abfrage erfolgte auf alle direkt in der Kategorie:Adressbuch enthaltenen Seiten (12.559) und Dateien (98). Bei der rekursiven Abfrage lief der Export in Fehler.
Zur Veranschaulichung ist auch eine Textdatei mit einem Kategorienbaum in Wikisyntax enthalten, die die Struktur darstellt.

Hoffe das passt so :grinning:
LG Bernd

Hallo Bernd,

Herzlichen Dank!

Ist genau was ich mir vorgestellt habe.

Gruß, Gerhard