SORU
26 ŞUBAT 2009, PERŞEMBE


HTML ayrıştırmak için normal ifadeler kullanarak: neden olmasın?

Soru soran düzenli HTML bazı bilgi kapmak için kullandığı stackoverflow her soru, kaçınılmaz olarak, "" bu HTML ayrıştırmak için normal ifade kullanmak için değil diyor. cevabı olacak gibi görünüyor

Neden olmasın? Bildiğim kadarıyla bu alıntı, tırnak içinde, "gerçek" HTML ayrıştırıcıları var Beautiful Soup ve eminim onlar güçlü ve yararlı, ama eğer sen yapmak bir şey basit, hızlı ve kirli, o zaman neden uğraşıyorsun kullanarak bir şey bu kadar karmaşık bir kaç düzenli ifadeler işe yarayacak mı iyi?

Ayrıca, onları genel olarak ayrıştırma için kötü bir seçim yapar bu sadece bir düzenli ifade hakkında anlamadığım bir temel var mı?

CEVAP
26 ŞUBAT 2009, PERŞEMBE


Tüm HTML ayrıştırma açılış eşleşen ve regexps ile mümkün olan kapanış etiketi bağlıdır beri düzenli ifadeler ile mümkün değildir.

Düzenli ifadeler sadece regular languages Maç olabilir ama HTML context-free language. Regexps ile yapabileceğiniz tek şey HTML sezgisel ama her koşulda çalışmaz. Yanlış herhangi bir düzenli ifade ile eşleşen olacak bir HTML dosyası sunmak mümkün olmalıdır.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Alan Fullmer

    Alan Fullmer

    3 EYLÜL 2010
  • jkimisyellow

    jkimisyellow

    6 Mayıs 2009
  • Rayone GB

    Rayone GB

    14 Temmuz 2007