SORU
7 Mart 2013, PERŞEMBE


Neden bazı ASCII karakter şeklinde ifade '\uXXXX' Java kaynak kodunu değil mi?

Bu tökezlemiştim (tekrar) bugün:

class Test {
    char ok = '\n';
    char okAsWell = '\u000B';
    char error = '\u000A';
}

Derleme:

Geçersiz karakter satır 4'te sabit.

Derleyici '\n' yerine. ben yazmak konusunda ısrarlı görünüyor Bunun için bir sebep göremiyorum, henüz değilçoksinir bozucu.

Özel bir gösterim var neden mantıklı bir açıklama (\t, \n, \rgibi) vargerekirJava kaynağı olduğu şeklinde ifade edilebilir?

CEVAP
7 Mart 2013, PERŞEMBE


Unicode karakter değeri ile değiştirilir, satır derleyici tarafından değiştirilir:

char error = '
';

Java geçerli bir deyim değildir.

Bu Language Specification tarafından dikte

Bir derleyici için Java programlama dili ("Java derleyici") ilk tanır Unicode kaçar kendi giriş, çeviren ASCII karakterler \u takip ederek dört onaltılık basamak için UTF-16 kod birimi (madde 3.1) gösterilen onaltılık değeri, ve geçen tüm diğer karakterler değişmiyor. Takıma giren karakterleri temsil eden iki ardışık Unicode kaçar gerektirir. Bu çeviri adım giriş Unicode karakter dizisi olur.

Bu şaşırtıcı şeyler neden olabilir, örneğin, bu geçerli bir Java programı (gizli unicode karakterleri içerir) - courtesy of Peter Lawrey:

public static void main(String[] args) {
    for (char c‮h = 0; c‮h < Character.MAX_VALUE; c‮h  ) {
        if (Character.isJavaIdentifierPart(c‮h) && !Character.isJavaIdentifierStart(c‮h)) {
            System.out.printf("x <%s>%n", (int) c‮h, ""   c‮h);
        }
    }
}

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • BioHunta

    BioHunta

    28 Mayıs 2006
  • itfigueres

    itfigueres

    12 EKİM 2013
  • thewinekone

    thewinekone

    17 Aralık 2005