23 Ocak 2010, CUMARTESİ
(grep) Düzenli ASCII olmayan karakterler maç için?
Linux üzerinde, çok sayıda dosya ile bir dizin var. Bazı karakterler ASCII olmayan ama UTF-8 hepsi geçerlidir. Bir program ASCII olmayan dosya adları ile çalışmayı engelleyen bir hata var ve nasıl etkilendiğini öğrenmek zorundayım. find
Bu *ve 8* ASCII olmayan karakterleri yazdırmak ve wc -l
numarasını bulmak için yapın bunu daha sonra yapacaktım. Grep olmak zorunda değil; herhangi bir standart Unıx kullanabilirim*10, *, AWK, **11 vb gibi regular expression,.
Ancak, düzenli bir ifade var, 'bir ASCII karakteri olmayan herhangi bir karakter'?
CEVAP
23 Ocak 2010, CUMARTESİ
Bu ASCII olmayan tek bir karakter maç olacak:
[^\x00-\x7F]
Bu PCRE geçerli (Perl-Uyumlu Düzenli İfade).
Ayrıca POSIX GZ kullanabilirsiniz:
[[:ascii:]]
- tek ASCII bir karakter ile eşleşir[^[:ascii:]]
- ASCII olmayan bir char tek maçlar
[^[:print:]]
muhtemelen sizin için yeterli olacaktır.**
Bunu Paylaş:
Nasıl UNIX ASCII olmayan tüm karakterl...
İngilizce olmayan karakterler maç için...
Nasıl python yorumlayıcısı yapmak doğr...
Nasıl ASCII olmayan karakterler bir di...
Nasıl ascıı olmayan karakterleri vurgu...