Re: Umlaute - enGenWiki

jesper@zedlitz.de schrieb:

Im GenWiki dürfen Umlaute NICHT als named entity von html geschrieben

werden.
gerd@schmerse.de schrieb:

Im en-GenWiki wird gerade dies in den Templates empfohlen. Sollte dann
vielleicht geändert werden...

Hi Jesper,
bezogen auf En-GenWiki würde ich HIERZU gerne noch einige weitere
Details geklärt haben. Ich kanns momentan leider nicht selbst testen, da ich
z.Zt. nur Zugriff auf PCs mit deutscher Spracheinstellung habe. Siehe Fragen
unten.
mhg, Alija

Fragen:
1. Wie sieht ein User des enGenWiki, einen Text der deutsche Umlaute
    enthält ?
    D.h. was ist das Endergebnis von - deutscher Umlaut - und
    MediaWiki SW-Version UND internationale Spracheinstellung UND
    internationale Spracheinstellung des Browsers (z.B. english Sprach-
    einstellung + I.E. in english oder tschechische Spracheinstellung etc.)

Die Volltextsuche funktioniert bei Wörtern mit Umlauten sonst nicht

2. Wie funktioniert die normale + Volltextsuche in En-GenWiki ?
    Bsp. A: Wort ist *mit* deutschem Umlaut geschrieben
    => ein normaler internationaler User hat davon aber meist,
         verständlicherweise keine Ahnung UND kann auf "normalem"
         Wege auch nicht danach suchen
    Bsp. B
    Im Wort ist Umlaut HTML-konform kaschiert (wie's ja sonst auch
    weltweit empfohlen od. gehandhabt wird) z.B. München
    Bsp. C
    Umlaute sind umgewandelt ala: "ü" ist "ue", "ö" = oe etc.
    => Wie 'case-sensitive' ist die Suchroutine von MediaWiki ?

Bezogen auf Gerd's sehr wichtigen Hinweis.

Im en-GenWiki wird gerade dies in den Templates empfohlen. Sollte dann
vielleicht geändert werden...

Das ist richtig. Diese Templates hab' ich für en-GenWiki erstellt (inkl. der
Hinweise auf Umlaut Kaschierung, die ja ansonsten auch weltweit genutzt wird.)
Ich ändere die Templates auch gerne ab. :slight_smile:

ABER, nicht bevor wir (SYS-Admins od. liste hier) eine eindeutige, technisch
geprüfte Aussage und Regelung haben, wie Umlaute zukünftig in den anderen
Sprachvarianten "kundenorientiert" dargestellt werden müssen, damit sichergestellt
ist, dass internationale GenWiki User nicht nur "Nonsens" Zeichen sehen.

Dies könnte, in Abhängigkeit der 'case-sensitivity' der Volltextsuche, z.B.
sein - alle Umlaute mit 2-Buchstaben zu schreiben (ß = ss, ü=ue etc.) ?

Neben der leichteren Nachvollziehbarkeit (ein Spracheingeweihter
kann immer noch erkennen, dass es sich dabei um einen Umlaut handelt)
und wohl fehlerfreierer internationalen Darstellung in Browsern, hätte dies
bei - dann umgewandelten Umlauten in der URL - auch den Vorteil, dass
man diese Seiten dann endlich *normal* abspeichern kann.

(z.Zt. kann man GenWiki Seiten + Wikipedia Seiten die Umlaute in der URL
haben, mit I.E. nicht normal abspeichern, der Inhalt wird nicht mit abgespeichert.
Es funktioniert nur, wenn man beim Speichern bewußt auswählt *Webseite, nur
HTML*. Im Quelltext wird dann jedoch leider die URL nicht mit abgespeichert
sowie die Images fehlen.)

Alijabav@aol.com wrote:

1. Wie sieht ein User des enGenWiki, einen Text der deutsche Umlaute
    enth�lt ?

Wenn er �ber einen einigerma�en aktuellen Browser verf�gt, sieht er alle
Zeichen. Zumindest die deutschen Umlauten sollten weltweit funktionieren, da
sie im Latin1-Zeichensatz enthalten sind. Bei osteurop�ische Zeichen k�nnte
es bei der Anzeige (egal, ob im Quelltext als einzelnes Zeichen oder named
entity geschrieben) gelegentlich Probleme geben, das sollte uns aber nicht
davon abhalten, die Namen korrekt zu schreiben.

> Die Volltextsuche funktioniert bei W�rtern mit Umlauten sonst nicht

2. Wie funktioniert die normale + Volltextsuche in En-GenWiki ?
    Bsp. A: Wort ist *mit* deutschem Umlaut geschrieben
    => ein normaler internationaler User hat davon aber meist,
         verst�ndlicherweise keine Ahnung UND kann auf "normalem"
         Wege auch nicht danach suchen

Eine Suche nach "Muller" findet derzeit kein "M�ller". Wie schon bei den
"exotischeren" Zeichen sollten wir uns dadurch aber nicht zwingen lassen,
falsche Namen zu schreiben. Dem Problem kann man lieber sp�ter mit Software
begegnen.

Beim GOV mache ich es z.B. so, da� ich zus�tzlich zum Namen einen
normalisierten Text in lateinischen Buchstaben erzeuge, bei dem alle
"T�telchen" weggelassen werden.

Jesper

- --
Jesper Zedlitz eMail : jesper@zedlitz.de
                  Homepage : http://www.zedlitz.de
                  ICQ# : 23890711