預備知識
爬取《帥啊》網的帥哥圖片!
URL : http://www.shuaia.net/index.html 先看一眼網站的樣子:
爬取單頁標的連結
透過審查元素,我們不難發現,標的的地址儲存在class屬性為”item-img”的標簽的href屬性中。這時候,有人可能會問為啥不用下麵的
標簽的src屬性?因為這個圖片是首頁的瀏覽圖片,根據這個地址儲存下來的圖片,太小了,並且不清清楚。秉承著熱愛“高畫質無碼”的精神,這種圖片可不是我想要的。因此,先獲取標的的地址,也就是我們點選圖片之後,進入的網頁地址,然後根據下一個網頁,找到圖片的地址。
程式碼
我們將爬取的資訊儲存到list中,圖片名字和圖片地址使用”=”連線,執行結果:
爬取多頁連結
翻到第二頁的時候,很容易就發現地址變了:www.shuaia.net/index_2.html。第三頁、第四頁、第五頁依此類推。
程式碼+執行結果
單張圖片下載
程式碼
整體程式碼
執行結果
作者:Jack-Cui
源自:http://blog.csdn.net/c406495762/article/details/72597755
宣告:文章著作權歸作者所有,如有侵權,請聯絡小編刪除