UTF8 Unterstützung

Aus Limbas Wiki

<-- zurück zur Hauptseite


Die UTF8 Unterstützung ist noch nicht zu 100% getestet und befindet sich im Beta-Status.

Die PDF-Berichterstellung von im UTF8-Format gespeicherten Daten ist noch nicht möglich. Aktuell wird für die Berichtserstellung UTF8 in ASCII konvertiert.

Installation

Um UTF-8 nutzen zu können, ist bei der LIMBAS-Installation ggf. abweichend von der "Standard"-Installation folgendes zu beachten:

  • Die Datenbank muss mit UTF8-Kodierung angelegt werden.
  • Bei Verwendung von PostgreSQL:
Benutzer "postgres":
$ psql
psql (8.4.2)
Geben Sie >>help<< für Hilfe ein

postgres=# create user <limbasuser> password '<limbasuserPW>';
CREATE ROLE

postgres=# create database <limbasDButf8> WITH ENCODING 'UTF8' OWNER <limbasuser> TEMPLATE template0;
CREATE DATABASE

postgres=#\q

$ createlang plpgsql <limbasDButf8>

$ psql -l

                                Liste der Datenbanken
     Name      | Eigentümer | Kodierung | Sortierfolge | Zeichentyp  | Zugriffsrechte
---------------+------------+-----------+--------------+-------------+-----------------------
<limbasDButf8> |<limbasuser>| UTF8      | C            | C           |
 postgres      | postgres   | SQL_ASCII | C            | C           |
 template0     | postgres   | SQL_ASCII | C            | C           | =c/postgres
                                                                     : postgres=CTc/postgres
 template1     | postgres   | SQL_ASCII | C            | C           | =c/postgres
                                                                     : postgres=CTc/postgres
(4 Zeilen)

$ createlang -l <limbasDButf8>
Prozedurale Sprachen
  Name   | Vertraut?
---------------------
 plpgsql | yes
  • Für das Anlegen der LIMBAS Datenbankstruktur muss
  • in der LIMBAS Installations-Maske die Option "charset" auf "UTF-8" gesetzt werden.
  • Die DB-Export Dateien im UTF-8-Format vorliegen.
Die im Download enthaltenen DB-Export Dateien ./dependent/BACKUP/clean.tar.gz und ./dependent/BACKUP/demo.tar.gz liegen im ISO-8859-1-Format vor. Um eine dieser Dateien nutzen zu können,
  • muss diese entpackt werden: tar xvfz <DateinameISO>
  • müssen alle entpackten Dateien nach UTF-8 konvertiert werden: Dazu kann beispielsweise "iconv" verwendet werden (iconv --from-code=ISO-8859-1 --to-code=UTF-8 <dateiISO> > <dateiUTF8>)
  • müssen alle konvertierten Dateien wieder gepackt werden: tar cvfz <DateinameUTF8>
  • Das PHP-Modul mbstring muss installiert sein, jedoch darf in der php.ini die mbstring.func_overload Funktion nicht gesetzt sein! Diese also entweder auskommentieren oder auf 0 setzen, da die String-Funktionen von LIMBAS selbst ersetzt werden um Kompatibilität mit externen frameworks zu gewährleisten.
  • PHP PCRE UTF-8 Problematik beachten.

Umgebungsvariablen

Die LIMBAS Umgebungsvariable "charset" muss ggf. von Hand auf "UTF-8" gesetzt werden.

Meine Werkzeuge
In anderen Sprachen