發表文章

目前顯示的是 9月, 2020的文章

(爬)搜狗壁紙批量下載

圖片
  搜狗壁紙批量下載 觀察搜狗網站型態 url:  https://pic.sogou.com/ 首頁如下 按下"壁紙" 接下來觀察可用資源的規律,操作請看視頻 裡面其中抓動態加載時有改變的地方,例如: 'https://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category\ = %E 5%A3 %81% E7%BA%B8&tag= %E 7%BE %8E%E 5%A5%B3& start=0 &len=15' 第一次加載是start=0,下拉後加載start=45,再下拉加載start=97....,加載的變數有點不規律, 但後面有一個len=15,試試看更改數量會不會跑出更多的更多的訊息.....,結果如此,那len 之後的數字就用str()放入變數來代。 程式碼解說 首先須匯入以下的庫 import  requests, json from  fake_useragent  import  UserAgent 為了以後可以重覆使用,使用繼承的模型 class   classname ():      def   __init__ ( self ):          pass      def   test ( self ):          pass 然後用隨機生成的UserAgent,防反爬 def   __init__ ( self ):         ua=UserAgent( verify_ssl = False )          for  i  in   range ( 1 ,  50 ):  ...