Encoding

PHP DOMDocument UTF-8 data into ISO-8859-1 document snippets

Encoding is hard in many cases. Today I ran into one, where we had to save UTF-8 data (from a Drupal website) into an XML document which requires ISO-8859-1 encoding.

We're using https://www.php.net/manual/de/class.domdocument.php for that, which seems to have some problems / flaws with such cases, as the following issues show:

MySQL: Tabelleninhalte nach UTF-8 umwandeln (von latin1 o.Ä.)

Mit folgendem MySQL Befehl könnt ihr relativ simpel ehemalige latin1 Felder zu UTF-8 umwandeln, z.B. nachdem ihr die Collation der gesamten Tabelle umgewandelt habt:


UPDATE tablename SET spaltenname=CONVERT(BINARY CONVERT(spaltenname USING latin1)USING utf8);

Softwareempfehlung: Batch-Umwandlung von Textdateien in UTF-8 mit UTFCast

Screenshot from UTFCast Express. Copyright © 2005 - 2011 RotatingScrew.com

Im Rahmen eines kleinen privaten Hobby-Projektes musste ich das Problem bewältigen, zahlreiche Textdateien von ISO-8859-1 ins UTF-8 Unicode Format zu überführen.
Bevor ich mich nun damit abquäle, diese Dateien manuell mit dem Editor in den gewünschten Zeichensatz zu überführen, habe ich mich auf die Suche nach einem hilfreichen Tool gemacht und bin fündig geworden. Dieses Tool möchte ich hier kurz empfehlen!