您現(xiàn)在的位置是:家裝資訊
爬蟲項(xiàng)目01-山東省招標(biāo)與采購(gòu)網(wǎng)
2019-01-28 00:00家裝資訊
簡(jiǎn)介# -*- coding: utf-8 -*- import scrapy from scrapy.cmdline import execute from urllib.parse import urljoin """ 山東省采購(gòu)與招標(biāo)網(wǎng) """ class SdbSpider(scrapy.Spider): name = sdb allowed_domains = [www.sdbidding.org.cn] # 招標(biāo)公告 #中標(biāo)公示 #...
# -*- coding: utf-8 -*-
import scrapy
from scrapy.cmdline import execute
from urllib.parse import urljoin
"""
山東省采購(gòu)與招標(biāo)網(wǎng)
"""
class SdbSpider(scrapy.Spider):
name = 'sdb'
allowed_domains = ['www.sdbidding.org.cn']
# 招標(biāo)公告 #中標(biāo)公示 #采購(gòu)公告 #成交公示
start_urls = ['http://www.sdbidding.org.cn/bulletins?infoType=11', 'http://www.sdbidding.org.cn/bulletins?infoType=12', 'http://www.sdbidding.org.cn/bulletins?infoType=13&type=1','http://www.sdbidding.org.cn/bulletins?infoType=14&type=2']
def start_requests(self):
num = 0
for start_url in self.start_urls:
while num<=20:#默認(rèn)爬取得頁(yè)數(shù),默認(rèn)爬取20頁(yè)
num+=1
yield scrapy.FormRequest (start_url,formdata={"pageNo":str(num)},callback=self.get_page)
def get_page(self,response):
start_url=response.url
urls=response.xpath('//td[@class="tit"]//a//@href').extract()
for url in urls:
end_url=urljoin(start_url,url)
yield scrapy.Request(url=end_url,callback=self.get_content)
def get_content(self,response):
#正文處理
title = response.xpath('//h3//text()').extract()[0]
print(title)
ctime = response.xpath('//div[@class="detail-title"]//p//text()').extract()[0]
print(ctime)
content = response.xpath('//div[@class="details"]//p//text()').extract()[0]
print(content)
content_xml = response.xpath('//div[@class="details"]')
print(content_xml)
if __name__ == '__main__':
execute(["scrapy", "crawl", "sdb"])
基于scrapy框架,只是簡(jiǎn)單寫了一下
有什么不好的地方歡迎大家指正,有什么錯(cuò)誤也歡迎大家給我指出來(lái),謝謝大家
歡迎大家多多關(guān)注,多多支持小編
Tags:爬蟲,項(xiàng)目,01-,山東省,招標(biāo),采購(gòu)網(wǎng),coding,ut
相關(guān)文章
- 這幾類房子值得購(gòu)買,未來(lái)升值空間大,優(yōu)勢(shì)性多
- 2020年最佳攪拌機(jī)
- 路虎攬勝五十周年紀(jì)念日
- 動(dòng)物穿越:新視野有一個(gè)肯德基快餐島
- 如果能在19號(hào)戰(zhàn)機(jī)上幸存下來(lái)的話,電影院看起來(lái)會(huì)大不
- iPhone11和11 Pro,2個(gè)月后:超寬攝像頭仍然是我們的
- 起亞賽多納小型貨車取笑,它看起來(lái)非常好
- 福特野馬Mach-E免提駕駛與特斯拉、通用汽車競(jìng)爭(zhēng)
- Facebook起訴開發(fā)者涉嫌濫用數(shù)據(jù)采集
- 到港巴士有望為大流行而優(yōu)化公共交通
隨機(jī)圖文
這幾類房子值得購(gòu)買,未來(lái)升值空間大,優(yōu)勢(shì)性多
伴隨著社會(huì)經(jīng)濟(jì)逐漸進(jìn)入到發(fā)展的階段,如今市場(chǎng)上早已擁有各種不一樣的房子,這就能夠有效增加大家在買房時(shí)...2020年最佳攪拌機(jī)
A廚房主食幾十年來(lái),攪拌機(jī)是喬遷、婚禮和畢業(yè)禮物的首?H綣?閬胍?煽詰謀?郴蟣?騁?希??鞘悄闋詈玫難≡。...iPhone11和11 Pro,2個(gè)月后:超寬攝像頭仍然是我們的
在三星Galaxy Note 10和Google Pixel 4等新手機(jī)發(fā)布的季節(jié)里,iPhone 11、11 Pro和Pro Max一開始就給我留下...如果能在19號(hào)戰(zhàn)機(jī)上幸存下來(lái)的話,電影院看起來(lái)會(huì)大不
電影院是我高中時(shí)的第二個(gè)家。由于一系列奇怪的家庭環(huán)境,我在大四的時(shí)候撞上了六個(gè)朋友的沙發(fā)、被褥和客床...
點(diǎn)擊排行

猜你喜歡
- 這幾類房子值得購(gòu)買,未來(lái)升值空間大,優(yōu)勢(shì)性多
- 2020年最佳攪拌機(jī)
- 路虎攬勝五十周年紀(jì)念日
- 動(dòng)物穿越:新視野有一個(gè)肯德基快餐島
- 如果能在19號(hào)戰(zhàn)機(jī)上幸存下來(lái)的話,電影院看起來(lái)會(huì)大不
- iPhone11和11 Pro,2個(gè)月后:超寬攝像頭仍然是我們的
- 起亞賽多納小型貨車取笑,它看起來(lái)非常好
- 福特野馬Mach-E免提駕駛與特斯拉、通用汽車競(jìng)爭(zhēng)
- Facebook起訴開發(fā)者涉嫌濫用數(shù)據(jù)采集
- 到港巴士有望為大流行而優(yōu)化公共交通