SORU
26 ŞUBAT 2010, Cuma


UTF-8: Genel? Bin? Unicode?

Veri türleri için kullanarak ne olması gerektiğini anlamaya çalışıyorum. Saklamak olacağım içeriği 0 kullanıcı tarafından gönderilir.

Benim anladığım UTF-8 General Cİ (büyük küçük Harf Duyarlı) yerine UTF-8 İkili kullanarak olmalıyım. Ancak, UTF-8 CI ve Unicode UTF-8 General Cİ arasında net bir ayrım bulamıyorum.

  1. Kullanıcı tarafından gönderilen UTF-8 içeriği Genel veya UTF-8 Unicode Cİ sütun saklamak gerekir?
  2. Ne tür veri UTF-8 İkili için geçerli olmak istiyorsunuz?

CEVAP
26 ŞUBAT 2010, Cuma


Genel olarakutf8_general_cidaha hızlıutf8_unicode_ciama daha az doğru.

İşte fark:

Herhangi bir Unicode karakter kümesi içinişlemleri _general_ci harmanlama kullanılarak yapılan _unicode_ci harmanlama için daha da hızlıdır. Örneğin, utf8_general_ci harmanlama için karşılaştırmalar daha hızlı, ama daha az doğru, utf8_unicode_ci için karşılaştırmalar. Bunun nedeni utf8_unicode_ci destekler açılımları gibi eşlemeleri; yani bir karakter diğer karakterler kombinasyonları eşit olarak karşılaştırır. Almanca ve diğer bazı dillerde, örneğin, “” eşit “ss”. ß utf8_unicode_ci da kasılmalar ve gözardı karakterleri destekler. utf8_general_ci olduğunu açılımları, kasılmalar, ya da gözardı karakterleri desteklemeyen eski bir alfabe. Sadece tek bir karakter arasında karşılaştırmalar yapabilirsiniz.

Alıntı: http://dev.mysql.com/doc/refman/5.0/en/charset-unicode-sets.html

Daha ayrıntılı açıklama için, lütfen MySQL forum aşağıdaki yazı okuyun: http://forums.mysql.com/read.php?103,187048,188748

Utf8_bin gelince: Her ikisi deutf8_general_civeutf8_unicode_cigerçekleştirmek küçük harf duyarlı karşılaştırma. İçinde karşıtlık,utf8_bin büyük küçük harfe duyarlıdırkarakterlerin ikili değerleri karşılaştırır. (diğer farklılıklar arasında),

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • boniver

    boniver

    17 NİSAN 2006
  • Kap Slap

    Kap Slap

    8 Mart 2010
  • Modus Recordings

    Modus Record

    26 Kasım 2008