8 Temmuz 2010, PERŞEMBE
Java ile kazıma
İyi bir web Java tabanlı API kazıma bulmak için güçlü değilim. Kazımak lazım hangi site herhangi bir API sağlamaz ve tüm web sayfaları bazı pageıd kullanarak üzerinde yineleme ve DOM ağaçlarından başka şeyler / HTML başlıkları ayıklamak istiyorum.
Yolları web kazıma daha başka var mı?
Teşekkürler
CEVAP
8 Temmuz 2010, PERŞEMBE
başlık zor değildir, ve birçok seçenek ( arama burada . size ayıklamak ^strong>Java HTML Ayrıştırıcıları)
içlerinden birini kullanın: http://jsoup.org/
eğer sayfa yapısını biliyorsanız sayfanın DOM kullanarak gidebilirsiniz: http://jsoup.org/cookbook/extracting-data/dom-navigation
onun iyi bir kütüphane ve ben benim son projelerinde kullanmak.
Bunu Paylaş:
Nasıl bir Java Dize belirteçleri kümes...
Java yuvarlak bir çift...
Java FileOutputStream Dosya Eğer yoksa...
Java isteğe bağlı parametreler...
Nasıl Java düzenli bir görev zamanlama...