SORU
8 Temmuz 2010, PERŞEMBE


Java ile kazıma

İyi bir web Java tabanlı API kazıma bulmak için güçlü değilim. Kazımak lazım hangi site herhangi bir API sağlamaz ve tüm web sayfaları bazı pageıd kullanarak üzerinde yineleme ve DOM ağaçlarından başka şeyler / HTML başlıkları ayıklamak istiyorum.

Yolları web kazıma daha başka var mı?

Teşekkürler

CEVAP
8 Temmuz 2010, PERŞEMBE


başlık zor değildir, ve birçok seçenek ( arama burada . size ayıklamak ^strong>Java HTML Ayrıştırıcıları)

içlerinden birini kullanın: http://jsoup.org/

eğer sayfa yapısını biliyorsanız sayfanın DOM kullanarak gidebilirsiniz: http://jsoup.org/cookbook/extracting-data/dom-navigation

onun iyi bir kütüphane ve ben benim son projelerinde kullanmak.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • MaximumPCMag

    MaximumPCMag

    23 Temmuz 2010
  • TeeMayneTV

    TeeMayneTV

    27 Kasım 2010
  • TitaniumBackup

    TitaniumBack

    10 EYLÜL 2011