Hallo Nicole,
da hast du völlig recht: Der Fachmann staunt und der Laie wundert sich.
Die Antwort ist etwas länglich – daher habe ich mir von der KI Gemini 3 Pro Preview helfen lassen, um das sauber auszuarbeiten:
Dass MediaWiki keine Fehlermeldung ausgibt, liegt daran, dass das System versucht, es „irgendwie passend“ zu machen. Die Ursache für die Probleme liegt in einem fundamentalen Unterschied in der Informatik, den moderne Systeme leider oft verschleiern: Der Unterschied zwischen Identifikatoren und Bezeichnungen.
Hier ist die Erklärung, warum das bei deinem Link (...Benutzer_-_in_memoriam) so problematisch ist:
1. Identifikator (Intern) vs. Bezeichnung (Anzeige)
Computer benötigen eindeutige Adressen, Menschen benötigen lesbaren Text.
- Die Bezeichnung (Label): Das ist das, was du auf dem Bildschirm siehst. Hier sind Leerzeichen, Umlaute, Emojis oder typografische Bindestriche (Gedankenstriche) willkommen.
- Beispiel:
Müller & Söhne – Geschäftsbericht
- Der Identifikator (ID): Das ist der interne „technische Name“, der für den Dateinamen auf dem Server oder die URL im Browser verwendet wird. Er muss extrem strikten Regeln folgen.
- Ideal:
mueller_soehne_geschaeftsbericht
Das Problem:
Apple hat hier früher mit der sogenannten Resource Fork technisch sauber getrennt: Der Dateiname im System war strikt, der Anzeigename für den Nutzer war frei wählbar.
Firmen wie Microsoft (Windows) und Organisationen wie die Wikimedia Foundation haben jedoch die irrige Vorstellung gefördert, Sonderzeichen könnten nach Belieben auch technisch verwendet werden. Sie mappen die Bezeichnung 1:1 auf den Identifikator. Das Ergebnis ist ein technischer „Hack“.
2. Die Falle: Sonderzeichen und UTF-8
Die Einführung des UTF-Zeichensatzes (Unicode) hat die Sache noch verführerischer, aber technisch komplexer gemacht.
Ein Computer „denkt“ in Bytes. In der Frühzeit der EDV (ASCII-Code) galt für jedes Zeichen die simple Regel: 1 Zeichen = 1 Byte.
Das funktioniert für a-z, 0-9 und den einfachen Bindestrich -.
Sobald wir aber UTF-8 für Sonderzeichen, Umlaute oder spezielle Striche nutzen, explodiert der Speicherbedarf für ein einzelnes Zeichen. Während Standard-Buchstaben weiterhin 1 Byte benötigen, braucht ein simples Sonderzeichen plötzlich mehr Platz:
- Zeichen aus dem ASCII-Satz (A-Z, 0-9, -): 1 Byte
- Sonderzeichen (ä, ö, —, é): 2 oder mehr Bytes
Da URLs im Internet (noch) keine echten Umlaute oder Sonderzeichen erlauben, müssen diese 2 Bytes in sogenannte Percent-Encodings umgewandelt werden.
- Aus einem ä (2 Bytes im Speicher) wird in der URL ein monströses
%C3%A4.
- Aus einem langen Gedankenstrich – (En-Dash) wird
%E2%80%93.
3. Analyse Deines Beispiels
Schau dir deinen Link genau an:
https://wiki.genealogy.net/Kategorie:Benutzer_-_in_memoriam
MediaWiki macht Folgendes: Es zwingt deine Eingabe (die Bezeichnung) in eine URL (den Identifikator).
- Es wandelt alle Leerzeichen automatisch in Unterstriche
_ um.
- Du hast einen Bindestrich
- verwendet, der von Leerzeichen umgeben war.
- Das Resultat ist die Zeichenfolge
_-_ (Unterstrich, Bindestrich, Unterstrich).
Das ist technisch zwar „erlaubt“ (daher keine Fehlermeldung), aber es ist semantisch unschön und fehleranfällig.
Wenn du statt des „Minus-Zeichens“ auf der Tastatur versehentlich einen „Gedankenstrich“ (oft macht Word das automatisch) verwendet hättest, wäre die URL komplett unlesbar geworden.
Fazit & Empfehlung
Um solche „Unfälle“ zu vermeiden, hilft es bei Kategorien und Seitennamen (die zu URLs werden) immer so zu tun, als wäre man im Jahr 1990:
- Keine Sonderzeichen in Titeln, die technischer Natur sind (Kategorien).
- CamelCase verwenden: Statt
Benutzer - in memoriam lieber BenutzerInMemoriam oder Benutzer_InMemoriam.
Daher nützt es, den Bindestrich und ggf. die Leerzeichen wegzulassen und alles zu vereinfachen.
Dann funktioniert es nicht nur, sondern bleibt auch stabil, wenn man den Link per E-Mail verschickt, anderswo verwenden möchte oder elektronisch auswertet.
VG
Wolfgang