31 Mart 2009, Salı
Unicode, ASCII, ANSI, UTF biçimi farklılıklar
Unicode, UTF8, UTF7, UTF16, UTF32, ASCII ve ANSI kodlamaları arasındaki fark nedir?
Ne şekilde bu programcılar için yararlı mı?
CEVAP
31 Mart 2009, Salı
Listenizde aşağı gidiyor:
- "Unicode kodlaması" UTF-16 olarak daha düzgün bir şekilde bilinmektedir: 2 bayt "kod noktası". başına Bu dizeleri yerli biçimidir .NET. Basic Multilingual Plane Dış değerleri (BMP) yedek çifti olarak kodlanır. (Bu çok az geliştiriciler onları almak gibi iyi bir işi olan nispeten nadiren kullanılır, sanırım. Ben bunu çok şüpheliyim.) "Unicode" gerçekten character set - bu terim ayrıca, UTF-16 ile eşanlamlı olarak kullanılan bir talihsizlik olur .NET ve çeşitli Windows uygulamaları.
- UTF-8:, 1-4 kodu başına bayt Değişken uzunlukta kodlama noktası. ASCII ASCII değerleri kullanarak 1 bayt olarak kodlanır.
- UTF-7: Genellikle posta kodlama için kullanılacak. Şansını eğer ihtiyacınız düşünüyorsanız ve posta yapmıyorsun, yanılıyorsun. (Bu sadece insanların haber grupları vb gönderme deneyimi - posta dışında, çok yaygın olarak hiç kullanılmıyor.)
- UTF-32: Sabit genişlik kodlama kod noktası başına 4 bayt kullanarak. Bu çok verimli değil, ama hayat daha kolay BMP dışında yapar. Bir ben var .NET MiscUtil kütüphanenin bir parçası olarak
Utf32String
sınıf, hiç istesin. (İyice test edilmiş değil, dikkatini çekerim.) - ASCII: Tek bayt kodlama sadece, alt 7 bit kullanarak. (Unicode kod noktaları 0-127.) Hayır vb aksan.
- ANSI: bir sabit ANSI kodlama yok - onlardan çok var. Genellikle ne zaman insanlar "" "varsayılan ayar" Encoding.Default yoluyla elde edilir ve genellikle Windows-1252 ama diğer yerel ayarlar olabilir. benim sistem için kod sayfası/demek ki ANSI
my Unicode page tips for debugging Unicode problems daha fazla var.
Kod diğer büyük kaynak hiç yolu çalışmak mümkün olacak daha fazla bilgi - muhtemelen en yararlı bit code charts içerir unicode.org.
Bunu Paylaş:
Python: hatasız ASCII Unicode Dönüştür...
Neden varsayılan kodlama ASCII olduğun...
Dönüştürme kaçtı ascıı dize dizeleri U...
Nasıl bir dize unicode veya ascıı kont...
Ascıı ve unicode arasındaki fark...