SORU
3 Temmuz 2009, Cuma


web sayfası bağlantıları python ve BeautifulSoup kullanarak almak

Nasıl bir web sayfasının bağlantıları almak ve bağlantıları kullanarak Python url adresini alabilir miyim?

CEVAP
3 Temmuz 2009, Cuma


Burada kısa bir Pasajı BeautifulSoup: SoupStrainer sınıfını kullanarak

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

BeautifulSoup belgelerine aslında oldukça iyi, ve tipik senaryoları bir dizi kapsar

http://www.crummy.com/software/BeautifulSoup/documentation.html

Edit: önceden ayrıştırma sen ne biliyorsan biraz (bellek ve hız bilge) daha verimli çünkü SoupStrainer sınıfı kullandım, Unutmayın.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • HuskyStarcraft

    HuskyStarcra

    4 HAZİRAN 2009
  • Peter Sharp

    Peter Sharp

    11 ŞUBAT 2013
  • superemposed

    superemposed

    25 Aralık 2007