您現(xiàn)在的位置是:經(jīng)驗(yàn)交流
“詩人”在別人網(wǎng)站寫詩怕丟了,又寫了段代碼把詩爬下來自己存著
2018-09-08 09:19經(jīng)驗(yàn)交流
簡介幾年來,連謅帶編,陸陸續(xù)續(xù)寫了六七十首詩,自以為有幾首可以傳世,可憐的自負(fù)之人!這些詩都寫在了中國詩歌網(wǎng),我怕自己不留一份底稿,網(wǎng)站哪天宕機(jī)了,丟了怪可惜。我想著百年之后有緣人也許覺得我寫的內(nèi)容有那么點(diǎn)意思。我是不是想多了。我還是保存一份吧...
幾年來,連謅帶編,陸陸續(xù)續(xù)寫了六七十首詩,自以為有幾首可以傳世,可憐的自負(fù)之人!這些詩都寫在了中國詩歌網(wǎng),我怕自己不留一份底稿,網(wǎng)站哪天宕機(jī)了,丟了怪可惜。我想著百年之后有緣人也許覺得我寫的內(nèi)容有那么點(diǎn)意思。我是不是想多了。
我還是保存一份吧。六七十首一篇篇復(fù)制粘貼也怪麻煩的,還是找點(diǎn)巧吧。人夠懶,才能帶動生產(chǎn)力的飛躍。
代碼貼在下面了,這段代碼的功能是從中國詩歌網(wǎng)的詳情頁獲取詩歌標(biāo)題和內(nèi)容,并保存到本地的記事本中,以便后續(xù)編輯、排版。(等我寫多了,考慮出本詩集,可能要等到猴年馬月,想想而已。)至于詩歌詳情頁的地址怎么來的,讀懂這段程序也就會從網(wǎng)站上抓取了,代碼都在這里,只是改下用Soup查找的class名稱就ok了。
去年,我寫過爬取蘇軾詩歌的文章,方法類似,感興趣的朋友,包括不知道怎么開始用Python編程的,請翻翻我之前的文章。
一個胡謅詩歌的都會寫代碼,相信你也會的。不然,以后怎們跟孩子一起愉快地玩耍。
import codecs
import requests
from bs4 import BeautifulSoup
#詩歌詳情頁列表,只放了幾首詩歌的詳情頁
poem_list = ['http://www.zgshige.com/c/2016-05-09/1197708.shtml',
'http://www.zgshige.com/c/2018-08-27/7003566.shtml',
'http://www.zgshige.com/c/2018-08-27/7003528.shtml']
#打開文件,一會要把詩保存到這個txt文件中
f = codecs.open("yunze_poem.txt","a","utf-8")
#獲取詩歌標(biāo)題和正文,把兩者拼接成一個字符串并返回
def get_a_poem(poem_page_url):
res = requests.get(poem_page_url)
html = res.content.decode("utf-8","ignore")
soup = BeautifulSoup(html)
poem_title_list = soup.find_all(class_="text-center b-b b-2x b-lt")
poem_title = poem_title_list[0]
poem_content_list = soup.find_all(class_="m-lg font14")
poem_content = poem_content_list[0]
a_whole_poem = str(poem_title.text) + str(poem_content)
return a_whole_poem
#獲取每一首詩歌,并寫到txt文件中
for url in poem_list:
a_whole_poem = get_a_poem(url)
f.write(a_whole_poem)
f.close()
Tags:詩人,別人,網(wǎng)站,寫詩,丟了,寫了,段代碼,代碼,詩爬,下來
相關(guān)文章
- 邁過高考這道坎,從此之后成為男子漢,網(wǎng)友:百善孝為
- 考前沖刺別亂補(bǔ)!考生飲食指南有妙招,不要盲目
- 熊孩子偷吃外賣進(jìn)醫(yī)院后續(xù):家長不道歉,還把鄰居告上
- 大學(xué)生不雅事件被傳,女生無法承受跳樓,請停止網(wǎng)暴
- 看看《星際迷航:皮卡德的大揭幕戰(zhàn)》是如何建立在CG層
- 美國宇航局,歐空局太陽天文臺發(fā)現(xiàn)第4000顆彗星
- 根據(jù)新法案,社交媒體公司可能因?qū)彶檎窝哉摱黄鹪V
- T-Mobile將T-Mobile擴(kuò)展到包括Sprint客戶在內(nèi)的周二
- 英國擁抱蘋果和谷歌重新思考冠狀病毒接觸追蹤應(yīng)用
- 天文學(xué)組織向埃塞俄比亞運(yùn)送了16000個回收的日食眼鏡
隨機(jī)圖文
邁過高考這道坎,從此之后成為男子漢,網(wǎng)友:百善孝為
6月7日的上午,他走出了考場接受記者的采訪,然后就馬上回到家中,給兩位老人送飯。這兩位老人,一位是自己...“詩人”在別人網(wǎng)站寫詩怕丟了,又寫了段代碼把詩爬下
幾年來,連謅帶編,陸陸續(xù)續(xù)寫了六七十首詩,自以為有幾首可以傳世,可憐的自負(fù)之人!這些詩都寫在了中國詩...活動策劃人常用的模板分享!
一個標(biāo)準(zhǔn)的活動策劃可能包含但不限于以下的內(nèi)容:活動主題:活動文案的一部分,讓用戶看的懂,明白你的活動...最牛 X 的代碼編輯器
前些日子搞小程序,但是微信官方的微信開發(fā)者工具實(shí)在太難用,就想著找一款能夠替代的代碼編輯器。因?yàn)橹?..
點(diǎn)擊排行

猜你喜歡
- 邁過高考這道坎,從此之后成為男子漢,網(wǎng)友:百善孝為
- 考前沖刺別亂補(bǔ)!考生飲食指南有妙招,不要盲目
- 熊孩子偷吃外賣進(jìn)醫(yī)院后續(xù):家長不道歉,還把鄰居告上
- 大學(xué)生不雅事件被傳,女生無法承受跳樓,請停止網(wǎng)暴
- 看看《星際迷航:皮卡德的大揭幕戰(zhàn)》是如何建立在CG層
- 美國宇航局,歐空局太陽天文臺發(fā)現(xiàn)第4000顆彗星
- 根據(jù)新法案,社交媒體公司可能因?qū)彶檎窝哉摱黄鹪V
- T-Mobile將T-Mobile擴(kuò)展到包括Sprint客戶在內(nèi)的周二
- 英國擁抱蘋果和谷歌重新思考冠狀病毒接觸追蹤應(yīng)用
- 天文學(xué)組織向埃塞俄比亞運(yùn)送了16000個回收的日食眼鏡