SORU
26 ŞUBAT 2009, PERŞEMBE


HTML ayrıştırmak için normal ifadeler kullanarak: neden olmasın?

Soru soran düzenli HTML bazı bilgi kapmak için kullandığı stackoverflow her soru, kaçınılmaz olarak, "" bu HTML ayrıştırmak için normal ifade kullanmak için değil diyor. cevabı olacak gibi görünüyor

Neden olmasın? Bildiğim kadarıyla bu alıntı, tırnak içinde, "gerçek" HTML ayrıştırıcıları var Beautiful Soup ve eminim onlar güçlü ve yararlı, ama eğer sen yapmak bir şey basit, hızlı ve kirli, o zaman neden uğraşıyorsun kullanarak bir şey bu kadar karmaşık bir kaç düzenli ifadeler işe yarayacak mı iyi?

Ayrıca, onları genel olarak ayrıştırma için kötü bir seçim yapar bu sadece bir düzenli ifade hakkında anlamadığım bir temel var mı?

CEVAP
26 ŞUBAT 2009, PERŞEMBE


Tüm HTML ayrıştırma açılış eşleşen ve regexps ile mümkün olan kapanış etiketi bağlıdır beri düzenli ifadeler ile mümkün değildir.

Düzenli ifadeler sadece regular languages Maç olabilir ama HTML context-free language. Regexps ile yapabileceğiniz tek şey HTML sezgisel ama her koşulda çalışmaz. Yanlış herhangi bir düzenli ifade ile eşleşen olacak bir HTML dosyası sunmak mümkün olmalıdır.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • MatheusDosGames

    MatheusDosGa

    28 Aralık 2011
  • Motor Trend Channel

    Motor Trend

    11 Mart 2006
  • Sean Murphy

    Sean Murphy

    4 ŞUBAT 2009