UTF-8

Das ist der Eintrag dazu aus unserem IT-Kommunikationslexikon:


Unicode Transformation Format-8

UTF-8 ist eine Codierungsformat für Unicode. Es verwendet eine variable Anzahl von Bytes für die Darstellung der Unicode-Zeichen. Sein wesentlicher Vorteil ist, dass die Zeichen, die dem ASCII-Zeichensatz entsprechen, mit einem Byte dargestellt werden können. Es lassen sich aber auch alle anderen Zeichen mit längeren Bytefolgen darstellen. Für den Wertevorrat von UTF-16 werden dazu 2 bis 5 Byte, für den Wertevorrat von UTF-32 2 bis 7 Byte benötigt. Durch diese Flexibilität und Effizienz ist UTF-8 die verbreiteteste Codierung für die Speicherung von Webseiten im Internet geworden. Ihr Nachteil ist, dass sie sich schlecht für die Verarbeitung innerhalb von Programmen eignet. Algorithmen wie das Durchsuchen oder Sortieren von Zeichenketten lassen sich besser mit Darstellungen wie UTF-16 oder UTF-32 ausführen, bei denen für alle Zeichen die gleiche Anzahl von Bytes verwendet wird.

Aktuelle Beiträge

Microsoft 365 E7 bündelt Funktionen in neuer Lizenzstufe

Mit Microsoft 365 E7 führt der Hersteller erstmals seit Jahren eine neue Enterprise-Lizenzstufe ein und bündelt zentrale Funktionen rund um KI, Sicherheit und Identitätsmanagement in einem Paket. Was auf den ersten Blick wie ein logischer Schritt wirkt, hat für Unternehmen weitreichende Folgen: Die neue "Frontier Suite" verändert nicht nur die Preisstruktur, sondern auch die strategische Ausrichtung im Microsoft-Ökosystem.