SORU
3 Temmuz 2009, Cuma


web sayfası bağlantıları python ve BeautifulSoup kullanarak almak

Nasıl bir web sayfasının bağlantıları almak ve bağlantıları kullanarak Python url adresini alabilir miyim?

CEVAP
3 Temmuz 2009, Cuma


Burada kısa bir Pasajı BeautifulSoup: SoupStrainer sınıfını kullanarak

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

BeautifulSoup belgelerine aslında oldukça iyi, ve tipik senaryoları bir dizi kapsar

http://www.crummy.com/software/BeautifulSoup/documentation.html

Edit: önceden ayrıştırma sen ne biliyorsan biraz (bellek ve hız bilge) daha verimli çünkü SoupStrainer sınıfı kullandım, Unutmayın.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • Hudson Music

    Hudson Music

    13 Mart 2007
  • Ralph Phillips

    Ralph Philli

    5 Aralık 2006
  • Samvith V Rao

    Samvith V Ra

    20 EKİM 2006