SORU
8 ŞUBAT 2012, ÇARŞAMBA


Test karakter kodlama sorunları için " bir dizi;Teşekkürler ipsums " dosyaları var mı?

Bizim ünlü var layouting "" nasıl göründüğünü test etmek için bir metin. Gereklilik haline gelmiştir için

Ne arıyorum Metin dosyaları metin dosyaları okurken JUnit testleri karakter kodlama ile ilgili bazı yöntemler test etmek için kullanabileceğiniz birçok farklı kodlama ile kodlanmış içeren bir dizi.

Örnek:

ISO 8859-1 Bir kodlanmış olması test-dosyası ve Windows-1252 kodlanmış dosya test. Windows-1252 bölge 80 farklılıklar tetiklemek için16– 9F16. Diğer bir deyişle bu bölgenin en az bir karakter ISO 8859-1 ayırmak için içermelidir.

Belki test dosyaları en iyi ayarlamak testi-dosya kodlama her nerede bir kez tüm karakterler içeriyor. Ama belki de heyecanla beklediğim bir haberim yok - bu kodlama tüm şeyler gibi, değil mi? :-)

Karakter kodlama sorunları için test-files gibi bir dizi var mı?

CEVAP
8 ŞUBAT 2012, ÇARŞAMBA


diacritics Wikipedia makale oldukça kapsamlı olduğunu, ne yazık ki bu karakterler el ile ayıklamak gerekiyor. Ayrıca her dil için bazı hatırlatıcılar olabilir. Lehçe örneğin kullanıyoruz:

Zażółć gęślą jaźń

tek doğru cümle 9 Polonya aksan içerir. Başka bir yararlı arama ipucu pangrams:cümleler en az bir kez alfabenin her harfini kullanarak:

  • İspanyolca, "El veloz y kivi feliz cardillo hindú comía murciélago. La cigüeña tocaba el saxofón de paja del palenque detrás."(27 harfler ve aksanlar).

  • Rusça, "Съешь же еще этих мягких французских булок, выпей чаю да"(33 Rus Kiril alfabesi).

List of pangrams kapsamlı bir özetini içerir. Herkes basit bu şal için bakım:

public interface NationalCharacters {
  String spanish();
  String russian();
  //...
}

kütüphane mi?

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Alfredo Garcia

    Alfredo Garc

    25 Mayıs 2007
  • Bart Baker

    Bart Baker

    1 Aralık 2006
  • huyked

    huyked

    28 Mart 2008