CESU-8

Das ist der Eintrag dazu aus unserem IT-Kommunikationslexikon:

Compatibility Encoding Scheme for UTF-16: 8-Bit

Mit der Erweiterung von UTF-16 in Unicode Version 4.0 auf maximal zwei 16-Bit-Gruppen pro Zeichen tauchte das Problem auf, dass viele existierende Unicode-Implementierungen von UTF-16 plötzlich inkompatibel geworden wären. Da sie nur von einer 16-Bit-Gruppe pro Zeichen ausgehen, wandeln sie längere Zeichen so nach UTF-8 um, als wären es zwei 16-Bit-Zeichen. Eigentlich ist aber vorgesehen, die zwei Gruppen in einen Unicode-Wert zurückzurechnen und diesen dann nach UTF-8 zurückzuwandeln.

Im Unicode Technical Report #26 wurde die abwärtskompatible Umwandlung als CESU-8 legalsiert.

Aktuelle Beiträge

Android-Geräte offline finden Daniel Richey Mi., 22.05.2024 - 13:43
Google hat die Funktion "Find my Device" ausgebaut. Fortan lassen sich auch Geräte, die offline sind, aufspüren. Eine Konsequenz daraus ist, dass Android-Geräte nun laufend ihren Standort mitteilen, wenn auch verschlüsselt und für Google nicht unmittelbar ersichtlich. Nutzer haben die Wahl, ob und wie sich die eigenen Devices an dem Dienst beteiligen.
Data Democracy im Unternehmen umsetzen Redaktion IT-A… Mi., 22.05.2024 - 13:19
Kein Zugang zu Daten bedeutet ineffizientes Management und einen Verlust an Wettbewerbsfähigkeit. Denn die mangelnde Informationsverfügbarkeit führt bei Mitarbeitern zu zeitraubenden Suchen und suboptimalen Prozessen. Eine Lösung dafür kann Data Democracy sein. Das Konzept verteilt den Datenzugriff im Unternehmen neu. So verkürzen sich Entscheidungsfindung, Ressourcen werden besser genutzt und Mitarbeiter sind befähigt, neue Ideen zu entwickeln.
Download der Woche: Pandoc Daniel Richey Mi., 22.05.2024 - 07:00
Für bestimmte Projekte ist die Konvertierung zwischen verschiedenen Markup-Formaten erforderlich. Häufig kommen dabei Standards wie Markdown, HTML, LaTeX oder E-Books zum Einsatz. Das kostenfreie Tool "Pandoc" ermöglicht die Umwandlung sowie das Lesen und Schreiben dieser Formate.