SORU
3 Temmuz 2009, Cuma


web sayfası bağlantıları python ve BeautifulSoup kullanarak almak

Nasıl bir web sayfasının bağlantıları almak ve bağlantıları kullanarak Python url adresini alabilir miyim?

CEVAP
3 Temmuz 2009, Cuma


Burada kısa bir Pasajı BeautifulSoup: SoupStrainer sınıfını kullanarak

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('a')):
    if link.has_attr('href'):
        print link['href']

BeautifulSoup belgelerine aslında oldukça iyi, ve tipik senaryoları bir dizi kapsar

http://www.crummy.com/software/BeautifulSoup/documentation.html

Edit: önceden ayrıştırma sen ne biliyorsan biraz (bellek ve hız bilge) daha verimli çünkü SoupStrainer sınıfı kullandım, Unutmayın.

Bunu Paylaş:
  • Google+
  • E-Posta
Etiketler:

YORUMLAR

SPONSOR VİDEO

Rastgele Yazarlar

  • BradleyWuzHere

    BradleyWuzHe

    25 NİSAN 2011
  • Elly Awesome

    Elly Awesome

    15 ŞUBAT 2010
  • Joseph Hayhoe

    Joseph Hayho

    20 Mayıs 2010