PHP, HTML und deutsche Eigentümlichkeiten

Datumsansicht Baumansicht Betreffansicht Attachement-Sicht

Autor: Andreas Fiesser (fiesser_at_gmx.net)
Datum: 01. Oct 2002


Hi,

bekanntermaßen weigern wir uns ja beharrlich, auf unsere Umlaute
völlig zu verzichten.
In HTML wird man dafür bestraft, in dem diese Sonderzeichen in
&code; umgesetzt werden (können). Mein Browser scheint aber auch mit
unkodierten Umlauten kein Problem zu haben.
Der W3C-Checker mault auch nicht und gab mir auf eine Testseite sein
"HTML 4.01 Strict" Prädikat.

Wann müßte ich Probleme erwarten, wenn ich die Zeichen pur einsetze
?

Der Head-Tag <meta http-equiv="content-type"
content="text/html;charset=utf-8"> sagt dem Browser doch was
da auf ihn zukommt.

Ich bin gerade dabei was mit PHP zu basteln, was aus einer Datenbank
Webseiten erzeugt.
Die Datenbank & Template-Geschichte funktioniert schon prima. Jetzt
will ich nur noch möglichst korrektes HTML erzeugen.

Es sollte dabei möglich sein, dass "technisch unbedarfte"
Mitarbeiter, dh die Geschäftsleitung, via einem Formular
Pressemeldungen einpflegen können sollen.

HTML-Tags zum Formatieren müßten im Textarea mit eigetragen werden
können und man sollen nicht &auml; statt ä schreiben müssen.

Da gibt es etliche PHP-Funktionen, die solche Texteingaben
HTML-sicher machen, zB htmlspecialchars() und htmlentities().
Die kodieren auch brav die Umlaute aber eben auch die gewünschen
HTML-Tags.

Ich könnte jetzt mit str_replace() die Umlaute selbst austauschen,
aber dann würden alle anderen denkbaren Sonderbuchstaben zB
französische noch nicht erfasst.

Gibt es dazu eine Lösung, oder ist das Problem gar keines, weil ich
den charset-Tag im HEAD habe ?

Und wo wir grad dabei sind ... hat schon jemand was mit einer
Auszeichnungssprache produziert, die wiederum automatisch in andere
übertragen werden kann ?
Also ich schreibe in X und ein Programm produziert daraus zB
wahlweise HTML, TeX, PDF.

Was nimmt man da am besten ?

... Andreas


Datumsansicht Baumansicht Betreffansicht Attachement-Sicht

Dieses Archiv wurde generiert von hypermail 2.1.4 : 01. Oct 2002 CEST