CESU-8


Compatibility Encoding Scheme for UTF-16: 8-Bit

Mit der Erweiterung von UTF-16 in Unicode Version 4.0 auf maximal zwei 16-Bit-Gruppen pro Zeichen tauchte das Problem auf, dass viele existierende Unicode-Implementierungen von UTF-16 plötzlich inkompatibel geworden wären. Da sie nur von einer 16-Bit-Gruppe pro Zeichen ausgehen, wandeln sie längere Zeichen so nach UTF-8 um, als wären es zwei 16-Bit-Zeichen. Eigentlich ist aber vorgesehen, die zwei Gruppen in einen Unicode-Wert zurückzurechnen und diesen dann nach UTF-8 zurückzuwandeln.

Im Unicode Technical Report #26 wurde die abwärtskompatible Umwandlung als CESU-8 legalsiert.

0-9|A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z|alle

Suche im Lexikon nach im

 

Fachartikel

DDoS-Bedrohungslage in 2022 [21.11.2022]

Cyberkriminelle greifen IT-Infrastrukturen an zahlreichen Einfallstoren an – etwa über Distributed-Denial-of-Service-Attacken. Neueste Daten aus dem DDoS-Report von Link11 zeigen, wie stark sich die Bedrohungslage im digitalen Raum heute äußert. Insgesamt weden die Angriffe kürzer, intensiver und anspruchsvoller. [mehr]

Grundlagen

Storage-Virtualisierung [16.06.2021]

In unserer Grundlagen-Rubrik erklären wir wichtige Aufgaben und Technologien aus dem Arbeitsalltag eines Netzwerk- und Systemadministrators. Hier erfahren Sie anhand prägnanter Erklärungen zu den wichtigsten Begriffen des jeweiligen Themenfeldes Hintergründe und Zusammenhänge in kompakter, praxisnaher Form. [mehr]