SORU
8 Temmuz 2010, PERŞEMBE


Java ile kazıma

İyi bir web Java tabanlı API kazıma bulmak için güçlü değilim. Kazımak lazım hangi site herhangi bir API sağlamaz ve tüm web sayfaları bazı pageıd kullanarak üzerinde yineleme ve DOM ağaçlarından başka şeyler / HTML başlıkları ayıklamak istiyorum.

Yolları web kazıma daha başka var mı?

Teşekkürler

CEVAP
8 Temmuz 2010, PERŞEMBE


başlık zor değildir, ve birçok seçenek ( arama burada . size ayıklamak ^strong>Java HTML Ayrıştırıcıları)

içlerinden birini kullanın: http://jsoup.org/

eğer sayfa yapısını biliyorsanız sayfanın DOM kullanarak gidebilirsiniz: http://jsoup.org/cookbook/extracting-data/dom-navigation

onun iyi bir kütüphane ve ben benim son projelerinde kullanmak.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Majestic Casual

    Majestic Cas

    28 NİSAN 2012
  • Paste Magazine

    Paste Magazi

    28 AĞUSTOS 2008
  • THELIFEOFPRICE

    THELIFEOFPRI

    16 Mart 2011