SORU
3 Temmuz 2009, Cuma


web sayfası bağlantıları python ve BeautifulSoup kullanarak almak

Nasıl bir web sayfasının bağlantıları almak ve bağlantıları kullanarak Python url adresini alabilir miyim?

CEVAP
3 Temmuz 2009, Cuma


Burada kısa bir Pasajı BeautifulSoup: SoupStrainer sınıfını kullanarak

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

BeautifulSoup belgelerine aslında oldukça iyi, ve tipik senaryoları bir dizi kapsar

http://www.crummy.com/software/BeautifulSoup/documentation.html

Edit: önceden ayrıştırma sen ne biliyorsan biraz (bellek ve hız bilge) daha verimli çünkü SoupStrainer sınıfı kullandım, Unutmayın.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • ExcelIsFun

    ExcelIsFun

    16 ŞUBAT 2008
  • MovieZoneET

    MovieZoneET

    22 Aralık 2009
  • READ DESCRIPTION NOW!!!!!!!

    READ DESCRIP

    18 ŞUBAT 2009