3 Temmuz 2009, Cuma
web sayfası bağlantıları python ve BeautifulSoup kullanarak almak
Nasıl bir web sayfasının bağlantıları almak ve bağlantıları kullanarak Python url adresini alabilir miyim?
CEVAP
3 Temmuz 2009, Cuma
Burada kısa bir Pasajı BeautifulSoup: SoupStrainer sınıfını kullanarak
import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer
http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')
for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')):
if link.has_attr('href'):
print link['href']
BeautifulSoup belgelerine aslında oldukça iyi, ve tipik senaryoları bir dizi kapsar
http://www.crummy.com/software/BeautifulSoup/documentation.html
Edit: önceden ayrıştırma sen ne biliyorsan biraz (bellek ve hız bilge) daha verimli çünkü SoupStrainer sınıfı kullandım, Unutmayın.
Bunu Paylaş:
Nasıl SQLite Python kullanarak satırı ...
Mikrosaniye almak için Python strftime...
Nasıl bir yönlendirme sayfası jQuery k...
Python kullanarak bir dosya var olup o...
Renkleri kullanarak Python ile termina...