Nasıl UTF-8 "değişken genişlikli kodlama" çalışıyor mu? | Netgez.com

SORU

9 EKİM 2009, Cuma

Nasıl UTF-8 "değişken genişlikli kodlama" çalışıyor mu?

Unicode standardı yeterince 4 bayt hepsini saklamak için gereken kod noktaları vardır. Bu UTF-32 kodlaması yapar. Henüz UTF-8 kodlaması bu şekilde bir şey kullanarak çok daha küçük alanlarda bu içine sıkar "değişken genişlik". kodlaması

Aslında, yönetir temsil etmek için ilk 127 karakter US-ASCII sadece bir bayt görünüyor ki, tıpkı gerçek ASCII, yorumlamak çok ascıı metin olarak UTF-8 olmadan bir şeyler yapmanın. Güzel numara. Nasıl çalışır?

Ben sadece anlamaya okumak için bir kaç şey yaptım ve başka biri olacak diye kendi soruma cevap rica edeceğim. Artı belki birileri eğer bazı yanlış anladım varsa düzeltin.

CEVAP

9 EKİM 2009, Cuma

Her baytı bir bayt kod noktası, çoklu bayt kod noktası olsun sana birkaç bit veya çoklu bayt kod noktası devamı ile başlar. Bu gibi:

0xxxxxxx tek bayt US-ASCII kod (ilk 127 karakter)

Multi-bayt kod-puan her başlangıç bir kaç bit aslında demek "hey, size ihtiyacımız da okuyun sonraki bayt (veya iki veya üç) anlamaya çalışıyorum." Bunlar:

110xxxxx Bir karakter izler

1110xxxx İki bayt izleyin

11110xxx Üç bayt izleyin

Son olarak, bu başlangıç kodları takip bayt bu gibi görünüyor:

10xxxxxx multi-byte karakterleri devamı

Eğer bir yerde bir şeyler karıştırılmış alırsa bile neye baktığını ilk birkaç bitten, sonra anlatırsın beri, bütün sırasını kaybetmek yok.

Bunu Paylaş:

Facebook
Twitter
Google+
E-Posta

Etiketler:

Unicode Utf-8 Karakter Kodlama Character-encoding Boş Multibyte

ÖNCEKİ

Basit bir istatistik...

SONRAKİ

SERİ Python...

AYNI ETİKETTEKİ VİDEOLAR

Anime Studio Webinar Serisi: Animasyon

Film ve Animasyon

Anime Studio Webinar Serisi: Animasyon...

15 HAZİRAN 2012

Güzel Temiz Buz Slovakça Dağlarda Yü

Seyahat ve Etkinlikler

Güzel Temiz Buz Slovakça Dağlarda Yü...

8 Aralık 2014

Sonic Kayıp Dünya Lansmanı Trailer (K

Oyun

Sonic Kayıp Dünya Lansmanı Trailer (K...

29 EKİM 2013

Deadpool - [Römork Comentado]

Kişiler ve Bloglar

Deadpool - [Römork Comentado]...

5 AĞUSTOS 2015

Superbowl Süper Kahraman İnceleme 2014 R

Eğlence

Superbowl Süper Kahraman İnceleme 2014 R...

4 ŞUBAT 2014

Yüz Anime Studio Gölgelendirme Kadar P

Nasıl Yapılır ve Stil

Yüz Anime Studio Gölgelendirme Kadar P...

29 Ocak 2014

Bir Udk Yükleme İndirme Gerçek Dışı Devel

Eğitim

Bir Udk Yükleme İndirme Gerçek Dışı Devel...

27 Mayıs 2011

Htc Bir M9 Altın Ve Galaxy S6 İnce? -

Bilim ve Teknoloji

Htc Bir M9 Altın Ve Galaxy S6 İnce? -...

9 ŞUBAT 2015

Haktip - Linux Terminal 101 - Dosya

Diğer

Haktip - Linux Terminal 101 - Dosya...

23 HAZİRAN 2012

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

Microsoft He

31 Mart 2009
Rugiagialia

1 Ocak 2008
TantalizingT

15 ŞUBAT 2009

İLGİLİ SORU / CEVAPLAR

1

&Quot;devam" anahtar kelime nedir...

23 Aralık 2008
2

Nasıl herhangi bir komut dosyası düzen...

28 EYLÜL 2008
3

Nasıl PyDev "almak Tanımsız değiş...

21 Ocak 2010
4

Javascript: nasıl "bu" değiş...

19 Ocak 2009
5

Nasıl {m}{n} ("tam olarak n kez&q...

23 EYLÜL 2013

İLGİLİ BAĞLANTILAR