SORU
23 Ocak 2010, CUMARTESİ


(grep) Düzenli ASCII olmayan karakterler maç için?

Linux üzerinde, çok sayıda dosya ile bir dizin var. Bazı karakterler ASCII olmayan ama UTF-8 hepsi geçerlidir. Bir program ASCII olmayan dosya adları ile çalışmayı engelleyen bir hata var ve nasıl etkilendiğini öğrenmek zorundayım. find Bu *ve 8* ASCII olmayan karakterleri yazdırmak ve wc -l numarasını bulmak için yapın bunu daha sonra yapacaktım. Grep olmak zorunda değil; herhangi bir standart Unıx kullanabilirim*10, *, AWK, **11 vb gibi regular expression,.

Ancak, düzenli bir ifade var, 'bir ASCII karakteri olmayan herhangi bir karakter'?

CEVAP
23 Ocak 2010, CUMARTESİ


Bu ASCII olmayan tek bir karakter maç olacak:

[^\x00-\x7F]

Bu PCRE geçerli (Perl-Uyumlu Düzenli İfade).

Ayrıca POSIX GZ kullanabilirsiniz:

  • [[:ascii:]] - tek ASCII bir karakter ile eşleşir
  • [^[:ascii:]] - ASCII olmayan bir char tek maçlar

[^[:print:]] muhtemelen sizin için yeterli olacaktır.**

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Andrey Menshikov

    Andrey Mensh

    28 Ocak 2012
  • Glyn Dewis

    Glyn Dewis

    25 AĞUSTOS 2007
  • nigahiga

    nigahiga

    21 Temmuz 2006