[Eisfair_dev] utf8 Umstellung (was: [e1] Frage zu MiniDLNA)

Marcus Roeckrath marcus.roeckrath at gmx.de
Fr Jan 23 23:46:17 CET 2015


Hallo Detlef,

Detlef Paschke wrote:

>> Ich sehe das etwas entspannter; ich habe mein System erfolgreich
>> umgestellt.
> 
> ich würde die Umstellung nun angehen suche aber noch eine verlässliche
> Anleitung dafür.

Ich habe mal eine gemacht, finde sie aber nicht wieder.

Hatte sie damals sogar ins Wiki gestellt, aber nach Bedenken von Thomas
wieder zurückgezogen/gesperrt.

Da kann vielleicht Yves mal schauen, ob die in den Untiefen des Wiki noch
auffindbar ist.

> Soweit ich mich erinnere hat Thomas Bork mal geschrieben, dass wohl nach
> dem Umwandeln der Dateinamen auf utf8 

Das ist natürlich notwendig.

> auch der Datei-Inhalt 
> textbasierter Dateien umgestellt werden muss. Dies betrifft natürlich
> keine binären Dateien. Wie ist es aber z.B. bei html-Dateien? Dort wird
> doch die Codierung zumeist bereits im Header angegeben. Muss da dann
> überhaupt noch was drin rumgeschraubt werden?

Es muss nicht jede Datei umgestellt werden:

Dateien, die irgendein Client auf dem eis abgelegt hat, sind in der
Client-Kodierung kodiert, dürfen also nicht umkonvertiert werden.

Korrekt erstellte HTML-Dateien (Kodierung und Zeichensatzangabe in der
HTML-Datei passen zueinander) auch nicht. Diese werden ja, so wie sie sind
per Apache an irgendeinen Browser ausgeliefert und erst dort interpretiert.

Allerdings bekommst Du Probleme beim Editieren dieser Dateien z. B. mit
mcedit auf dem eis, wenn lokaler Zeichensatz und Zeichensatz der Datei
nicht passen.

Dann sind da noch diverse Textdateien auf dem eis selbst, die also zum
eisfair-System bzw. zu diversen Paketen gehören. (Dokumentationen
in /usr/share/doc, über das System verteilte Skripte); also im Prinzip
Textdateien.

Einige davon enthalten Umlaute; manche liegen in aktuelleren Paketen dann
aber auch schon in utf statt iso vor.

Die Umlaute in den Skripten lagen nach meiner Erfahrung aber nur in
Kommentarzeilen vor, sind also nur kosmetischer Art.

Auf keinen Fall darfst Du IMHO Datenbankdateien umkonvertieren, das dürfte
die Tabellen zerstören. Ist aber auch nicht notwendig da mysql und Co den
verwendeten Zeichensatz in der Datenbankdefinitionen ablegen. Man kann aber
die datenbanksysteme nun auf utf unkonfigurieren, damit zukünftige (neue)
Datenbanken in utf-Kodierung angelegt werden.

1. Mit convmv erstmal schauen, wieviele Dateinamen betroffen sind; die
dateinamenskonvertierung findet erst statt, wenn Du den Parameter --notest
angibst.

2. Mit find und file --mime-encoding mal das ganze Dateisystem nach
iso-kodierten Dateien absuchen. Dann siehst Du, wie groß der Umfang sein
wird.

-- 
Gruss Marcus


Mehr Informationen über die Mailingliste Eisfair_dev