SORU
31 Mart 2009, Salı


Sabit XML ayrıştırma ve düzenli HTML için neden bazı örnekler verebilir misiniz?

over over again yapan insanlar görüyorum bir hata XML ayrıştırma veya bir düzenli ifade ile HTML için çalışıyor. Burada XML ve HTML ayrıştırma zor olmasının nedenlerinden birkaçı:

İnsanlar çizgiler bir dizi olarak bir dosya tedavi etmek istiyor, ama bu geçerli

<tag
attr="5"
/>

İnsanları tedavi < veya <etiketi başlangıç etiketi gibi, ama bu gibi şeyler vahşi: var

<img src="imgtag.gif" alt="<img>" />

İnsanlar genellikle etiketleri biten, ama etiketler ve kendilerini içerir izin XML HTML başlangıç etiketleri geleneksel yukarıdaki diyagram yapamazsınız kolu olan maç için

<span id="outer"><span id="inner">foo</span></span>

İnsanlar sık sık istiyor maçında karşı içeriğin bir belge (gibi ünlü "bulmak tüm telefon numaralarının belirli bir sayfa" sorun), ama veri olabilir işaretlenmiş (bile görünüyor normal izlendi):

<span class="phonenum">(<span class="area code">703</span>)
<span class="prefix">348</span>-<span class="linenum">3020</span></span>

Yorumlar kötü biçimlendirilmiş veya eksik etiketleri içerebilir:

<a href="foo">foo</a>
<!-- FIXME:
    <a href="
-->
<a href="bar">bar</a>

Diğer sorunlar ne olduğunun farkında mıydınız?

CEVAP
31 Mart 2009, Salı


İşte sizin için bazı eğlenceli geçerli XML:

<!DOCTYPE x [ <!ENTITY y "a]>b"> ]>
<x>
    <a b="&y;>" />
    <![CDATA[[a>b <a>b <a]]>
    <?x <a> <!-- <b> ?> c --> d
</x>

Ve sevinç bu küçük paket geçerli HTML

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" [
    <!ENTITY % e "href='hello'">
    <!ENTITY e "<a %e;>">
]>
    <title>x</TITLE>
</head>
    <p id  =  a:b center>
    <span / hello </span>
    &<br left>
    <!---- >t<!---> < -->
    &e link </a>
</body>

Geçersiz yapıları için tarayıcı özgü tüm ayrıştırma cabası.

İyi şanslar karşı düzenli delik!

DÜZENLE (Jörg W Mittag): Burada iyi biçimlendirilmiş, HTML 4 . 01 geçerli: başka bir güzel parça

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
  "http://www.w3.org/TR/html4/strict.dtd"> 
<HTML/
  <HEAD/
    <TITLE/>/
    <P/>

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Codecourse

    Codecourse

    3 ŞUBAT 2009
  • ŠĩŗĜŕôŵåɭȍҭҭ

    ŠĩŗĜŕô

    29 Kasım 2009
  • spyib

    spyib

    9 Ocak 2007