SORU
8 Temmuz 2010, PERŞEMBE


Java ile kazıma

İyi bir web Java tabanlı API kazıma bulmak için güçlü değilim. Kazımak lazım hangi site herhangi bir API sağlamaz ve tüm web sayfaları bazı pageıd kullanarak üzerinde yineleme ve DOM ağaçlarından başka şeyler / HTML başlıkları ayıklamak istiyorum.

Yolları web kazıma daha başka var mı?

Teşekkürler

CEVAP
8 Temmuz 2010, PERŞEMBE


başlık zor değildir, ve birçok seçenek ( arama burada . size ayıklamak ^strong>Java HTML Ayrıştırıcıları)

içlerinden birini kullanın: http://jsoup.org/

eğer sayfa yapısını biliyorsanız sayfanın DOM kullanarak gidebilirsiniz: http://jsoup.org/cookbook/extracting-data/dom-navigation

onun iyi bir kütüphane ve ben benim son projelerinde kullanmak.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Dave Wallace

    Dave Wallace

    27 Kasım 2007
  • InfinityWard

    InfinityWard

    19 EYLÜL 2006
  • LearnKey

    LearnKey

    19 AĞUSTOS 2008