UTF-8

für die Liste aller Seiten

Administratoren

UTF-8 unterstützt alle Sprachen und Alphabete einschließlich asiatischer Sprachen und ihre Zeichenvielfalt. Es ist eine weit verbreitete und flexible Zeichen-Kodierung.

Es ist ziemlich einfach, UTF-8 auf ihren Wikiseiten zu ermöglichen. Aktuelle PmWiki-Versionen enthalten die UTF-8-Datei, die standardmäßig in der sample-config.php-Datei aktiviert ist.

UTF-8 in einem neuen Wiki aktivieren

Wenn Sie ein neues Wiki in irgend einer Sprache mit der neuesten PmWiki-Version aufsetzen, sollten Sie UTF-8 auf jeden Fall aktivieren. In der Zukunft wird PmWiki die UTF-8-Kodierung als Standard benutzen. Wenn Sie UTF-8 schon nutzen, müssen Sie später keine umfangreiche "Migration" auf UTF-8 vornehmen.

Um UTF-8 zu aktivieren, fügen Sie die folgende Zeile in der Nähe des Anfangs Ihrer ''config.php-Datei ein (die Datei docs/sample-config.php'' enthält dies Zeile bereits):

  include_once("scripts/xlpage-utf-8.php");

Diese Zeile sollte vor dem Aufruf der XLPage()-Funktion in internationalisierten Wikis stehen.

Speichern Sie Ihre config.php-Datei als UTF-8 (ohne BOM) kodiert. Das erlaubt Einträge mit UTF-8-kodierten Zeichen. Stellen Sie sicher, dass Ihr Editor das unterstützt und testen Sie das, indem Sie ein paar UTF-8-Zeichen von außerhalb des ASCII-Bereiches einfügen, die Sie dann in dem Editor sehen sollten 1.

Wenn Sie UTF-8 so aktiviert haben, können Sie auch die Klassen 'rtl' und 'ltr' einsetzen, die anbieten, die Textrichtung auf von-rechts-nach-links oder von-links-nach-rechts einzustellen. Das ist nützlich für die Einschließung von von-rechts-nach-links-Skripten wie Arabisch, Farsi (Persisch), Hebräisch, Urdu und andere.

UTF-8 in existierenden Wikis aktivieren

Momentan ist dies nur möglich, wenn Ihre Gruppen- und Seiten-Namen sowie Ihre Upload-Namen keine internationalen Zeichen enthalten. Die Namen der Wikiseiten werden als Dateinamen benutzt und es gibt noch keinen einfachen Weg, diese Namen umzubenennen.

Wenn Ihr Wiki keine internationalen Seiten-/Gruppennamen enthält, führen Sie zuerst eine Aktualisierungen auf die jüngste Version durch.

Um UTF-8 zu aktivieren:

  1. löschen Sie die Datei wiki.d/.pageindex. Diese Datei enthält einen Zwischenspeicher ('cache') der Verweise und Wörter Ihrer Seiten und wird für die Suche und für Seitenlisten benutzt. PmWiki baut diese Datei mit der neuen Zeichen-Kodierung neu auf.
  2. fügen Sie dann die folgenden Zeilen in der Nähe des Anfangs Ihrer config.php-Datei ein:
  include_once("scripts/xlpage-utf-8.php");
  $DefaultPageCharset = array(''=>'ISO-8859-1'); # siehe unten

Diese Zeilen sollten vor dem Aufruf der XLPage()-Funktion in internationalisierten Wikis stehen.

Die $DefaultPageCharset-Zeile soll helfen, einige Seiten zu berichtigen und korrekt zu behandeln, die fehlende oder falsche Attribute haben und in älteren PmWiki-Versionen erstellt wurden.

  • Die meisten Wikis in europäischen Sprachen werden wahrscheinlich in der ISO-8859-1-Kodierung erstellt worden sein und sollten
    $DefaultPageCharset = array(''=>'ISO-8859-1');
    nutzen,
  • Wikis in Tschechisch oder Ungarisch werden wahrscheinlich in der ISO-8859-2-Kodierung erstellt worden sein und sollten stattdessen die Zeile
    $DefaultPageCharset = array(''=>'ISO-8859-2', 'ISO-8859-1'=>'ISO-8859-2');
    nutzen,
  • Wikis in Türkisch werden wahrscheinlich in der ISO-8859-9-Kodierung erstellt worden sein und sollten stattdessen die Zeile
    $DefaultPageCharset = array(''=>'ISO-8859-9', 'ISO-8859-1'=>'ISO-8859-9');
    nutzen.

Unterstützung von Sprachen mit RTL-(von-rechts-nach-links)-Schreibweise

Sprachen wie Arabisch, Hebräisch, Farsi (Persisch), Urdu und andere werden von rechts nach links geschrieben. Die Klassen rtl und ltr können eingesetzt werden, um die Schreibrichtung unabhängig von der generellen Einstellung der Schreibrichtung der Seite einzustellen, zum Beispiel:

>>rtl<<
يتدفق هذا النص من اليمين إلى اليسار
>>ltr<<
Dieser Text fließt nach rechts.
>><<

يتدفق هذا النص من اليمين إلى اليسار

Dieser Text fließt nach rechts.

Wenn Sie die Schreibrichtung für ein Wiki generell auf RTL einstellen wollen, können Sie zur config.php-Datei eine Zeile wie diese einfügen:

$HTMLStylesFmt['rtl'] = " body { direction:rtl; }"

Doch der Skin, den Sie benutzen, verlangt eventuell weitere Anpassungen, zum Beispiel um das Suchfeld und die Seitenaktionen auf die andere Seite zu bringen etc.

Einige Skins wie Amber haben volle RTL-Unterstützung.

Der Gebrauch von UTF-8 in Seitennamen und URLs

Das Aktivieren von UTF-8 erlaubt, internationale Zeichen in Seitennamen zu benutzen (für Dateinamen siehe $UploadNameChars).

Es gibt gute Gründe, UTF-8 in Seitennamen zu nutzen. Einfachere Konfiguration, funktioniert 'out of the box'. Leichtere Handhabung von Seitentiteln (keine Notwendigkeit, eine (:title ...:)-Direktive einzufügen. Die Möglichkeit, unterschiedliche Seiten für verschieden akzentuierte Wörter zu haben, zum Beispiel in einem Wörterbuch oder in einem Wortschatz-Wiki. Besseres SEO, wenn Ihre URLs auf gewisse Suchbegriffe passen.

Außerdem, wenn Sie die URLs kopieren, die URL-kodierte internationale Zeichen enthalten können, zeigen die modernen Browser die tatsächlichen Zeichen in der URL-Zeile an, und bedeutende Suchmaschinen verstehen die internationale URLs und zeigen sie dekodiert in den Suchergebnissen an.

Auf der anderen Seite mögen es manche Leute bevorzugen, die Seiten- und Dateinamen auf grundlegende ASCII-Zeichen zu beschränken, insbesondere wenn die Sprache überwiegend das lateinische Alphabet benutzt.

Einer der Gründe kann sein, dass Sie klare URLs wie ihr-wiki.org/Francais/Champs-Elysees haben möchten anstatt ihr-wiki.org/Fran%C3%A7ais/Champs-%C3%89lys%C3%A9es (für eine Seite namens [[Français.Champs-Élysées]]). Siehe auch ISO8859MakePageNamePatterns(englisch).

Heutzutage sollte es nicht viele Probleme mit dem Gebrauch von internationale Zeichen in Seiten- und Dateinamen in UTF-8 geben. Doch sollten Sie eines Tages den Server oder das Betriebssystem wechseln, sind einfache lateinische Zeichen besser zu portieren und das Risiko, dass dabei etwas in die Brüche geht, ist eher gering.

PmWiki wandelt automatisch Seitentext und Metatdaten zwischen den Kodierungen um, kann aber im Moment die Dateinamen und Anhänge nicht automatisch umbenennen.

Wenn Sie schon internationale Zeichen in Dateinamen (Seitennamen, Uploads) haben, sollten Sie nach dem Aktivieren von UTF-8 Ihre Wikiseiten und Verweise überprüfen – Sie müssen eventuell einige der Dateinamen umbenennen.

Anmerkungen

  • Sie müssen Ihre config.php-Datei in der UTF-8-Kodierung speichern, und zwar "without Byte Order Mark (BOM)".
    Siehe Zeichensatz der config.php-Datei (deutsch).
  • Diese Seite bezieht sich auf die jüngste Version von PmWiki. Siehe auch Cookbook:UTF-8 für weitere Tipps zu älteren Versionen (A collection of UTF-8 related tips and fixes,englisch).
  • Falls Ihre PmWiki-Installation die falsche Kodierung anzeigt oder eine UTF-8-Seite unerklärlicherweise in einer anderen Kodierung speichert, könnten Sie Ihre .htaccess-Einstellungen in dem Wurzelverzeichnis Ihrer gespeicherten Seiten kontrollieren.

für die Liste aller Seiten


Übersetzung von PmWiki.UTF-8,   Originalseite auf PmWikiDe.UTF-8   —   Rückverweise

Zuletzt geändert:   PmWikiDe.UTF-8am 11.02.2023
 PmWiki.UTF-8am 10.02.2023