SORU
9 Aralık 2010, PERŞEMBE


Başlık ne karakter kodlaması HTTP gerekir?

Ben kullanarak bir "eğlenceli" HTML Özel Karakter (✰) (http://html5boilerplate.com/ Daha fazla bilgi için) Server HTTP-başlık ve merak ediyorum eğer "izin" başına spec.

  • SP 3 Windows Xp üzerinde Chrome dev tools Ağ Sekmesini kullanarak ✰ iyi bakın.

  • IE8 içinde ✰değildoğru işlenmiş.

  • W3.org HTML doğrulayıcı yapardeğildoğru işlemek (görüntüler "â°" yerine).

Şimdi, karakter kodlamaları pek hevesli değilim ... ve açıkçası çok umrumda değil; ben dedim cus körü körüne UTF-8 kullanın. :-)


Eşitsizlik farklı ayrıştırıcıları/göz/motorlar/bugs---adı her neyse) neden olur?

Orada HTTP-başlık için bu belki de izin verilen karakter listesi için bir spec "değer"?

CEVAP
10 Aralık 2010, Cuma


Kısacası: Sadece ASCII iş güvencesi. ASCII olmayan bazı veriler geriye dönük uyumluluk için izin verilir, ancak görüntülenebilir olması gerekiyordu değildir.

HTTPbis gave up ve başlıklarında ASCII ayrıca yararlı kodlama yok belirtilen:

Tarihsel olarak, HTTP alanı metin ile içerik olarak izin verdi ISO-8859-1 karakter seti [ISO-8859-1], sadece diğer karakter grupları destekleme [RFC2047] kodlama kullanın. Uygulamada, en HTTP header alan değerleri, US-ASCII karakter kümesi yalnızca bir kısmını [USASCII] kullanın. Yeni tanımlanan başlık alanlar alan değerlerine sınırı OLMALI US-ASCII sekizli. Bir alıcı alanında diğer sekizli davranmalı içerik (obs-metin) opak veri olarak.


Daha önce, 1999 RFC 2616 bu tanımlanmış:

*METİN, kelimeler karakter kümesi ISO-dışındaki karakterler içerebilir RFC 2047 kuralları [14] göre kodlanmış sadece 8859-1 [22].

ve RFC 2047 olur MIME encoding:

=?UTF-8?Q?=E2=9C=B0?=

ama birçok (varsa) Müşteri Desteği olduğunu sanmıyorum.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Bokeh

    Bokeh

    9 HAZİRAN 2014
  • MisterBrightside

    MisterBright

    24 Mart 2006
  • Stanislav Petrov

    Stanislav Pe

    7 ŞUBAT 2009