UTF-8


Unicode Transformation Format-8

UTF-8 ist eine Codierungsformat für Unicode. Es verwendet eine variable Anzahl von Bytes für die Darstellung der Unicode-Zeichen. Sein wesentlicher Vorteil ist, dass die Zeichen, die dem ASCII-Zeichensatz entsprechen, mit einem Byte dargestellt werden können. Es lassen sich aber auch alle anderen Zeichen mit längeren Bytefolgen darstellen. Für den Wertevorrat von UTF-16 werden dazu 2 bis 5 Byte, für den Wertevorrat von UTF-32 2 bis 7 Byte benötigt. Durch diese Flexibilität und Effizienz ist UTF-8 die verbreiteteste Codierung für die Speicherung von Webseiten im Internet geworden. Ihr Nachteil ist, dass sie sich schlecht für die Verarbeitung innerhalb von Programmen eignet. Algorithmen wie das Durchsuchen oder Sortieren von Zeichenketten lassen sich besser mit Darstellungen wie UTF-16 oder UTF-32 ausführen, bei denen für alle Zeichen die gleiche Anzahl von Bytes verwendet wird.

0-9|A|B|C|D|E|F|G|H|I|J|K|L|M|N|O|P|Q|R|S|T|U|V|W|X|Y|Z|alle

Suche im Lexikon nach im

 

Fachartikel

Emotet – Ein zerstörerisches Comeback [7.12.2022]

Im Jahr 2014 tauchte Emotet zum ersten Mal auf – zunächst als bescheidener Banking-Trojaner. Doch die Cyberkriminellen hinter der Malware dachten weiter: Sie boten als eine der ersten Gruppen Malware-as-a-Service an und nutzen es erfolgreich, um ein massives Botnetz infizierter Systeme aufzubauen und den Zugang an Dritte zu verkaufen. Nach langer Ruheperiode gab es Ende 2021 ein Comeback – und zwar ein rasantes: Bis April 2022 stiegen die Emotet-Fälle um ganze 2700 Prozent. Unser Fachartikel trägt einige Erkenntnisse zu den neuen Methoden und Gefahren von Emotet zusammen. [mehr]

Grundlagen

Storage-Virtualisierung [16.06.2021]

In unserer Grundlagen-Rubrik erklären wir wichtige Aufgaben und Technologien aus dem Arbeitsalltag eines Netzwerk- und Systemadministrators. Hier erfahren Sie anhand prägnanter Erklärungen zu den wichtigsten Begriffen des jeweiligen Themenfeldes Hintergründe und Zusammenhänge in kompakter, praxisnaher Form. [mehr]