SORU
8 Temmuz 2010, PERŞEMBE


Java ile kazıma

İyi bir web Java tabanlı API kazıma bulmak için güçlü değilim. Kazımak lazım hangi site herhangi bir API sağlamaz ve tüm web sayfaları bazı pageıd kullanarak üzerinde yineleme ve DOM ağaçlarından başka şeyler / HTML başlıkları ayıklamak istiyorum.

Yolları web kazıma daha başka var mı?

Teşekkürler

CEVAP
8 Temmuz 2010, PERŞEMBE


başlık zor değildir, ve birçok seçenek ( arama burada . size ayıklamak ^strong>Java HTML Ayrıştırıcıları)

içlerinden birini kullanın: http://jsoup.org/

eğer sayfa yapısını biliyorsanız sayfanın DOM kullanarak gidebilirsiniz: http://jsoup.org/cookbook/extracting-data/dom-navigation

onun iyi bir kütüphane ve ben benim son projelerinde kullanmak.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • BASS212M

    BASS212M

    15 Temmuz 2009
  • BioHunta

    BioHunta

    28 Mayıs 2006
  • LinusTechTips

    LinusTechTip

    25 Kasım 2008