如何下載圖片?
- 點擊
添加字段
。 - 鼠標點擊網頁中的圖片,程序自動獲取圖片地址。(已有字段,選擇
重新選擇元素
,然后點擊圖片) -
選擇要下載的字段,點擊菜單按鈕,選擇
文件下載
菜單。 -
設置文件名和圖片的保存路徑。。
-
完成
關于自定義文件名
在爬山虎采集器中,可以使用一些自定義變量來命名文件名,比如任務名稱、時間格式、隨機字符、以及使用字段值來命名。這些之間可以自由組合。
關于自定義目錄
在文件名中加入字符/
,就可以生成目錄。 比如設置文件名為 {title}/{原文件名}
就會自動創建{title}
目錄,然后以原文件名保存。
關于替換內容地址
如果采集的內容是要發布到網站上面,有下載圖片的話,那就需要使用替換內容地址。
把內容中的原網站圖片地址替換為本地的相對地址,發布到網站后,在使用FTP軟件把圖片批量上傳到網站目錄,這樣網頁才會正常顯示。
(一般網站都會對圖片進行防倒鏈處理,禁止第三方網站直接引用)
如何下載多張圖片
下載多張圖片,我們需要修改圖片XPath,來匹配多張圖片。 具體XPath如何編寫 參考
如何下載文章HTML內的多張圖片
采集新聞、文章內容時,如果內容中包含圖片,我們需要采集文章的HTML形式,設置取值屬性為InnerHTML
或者OuterHTML
。 然后直接設置下載即可,程序會自動檢測內容中IMG標簽,并且下載圖片。
延時加載(懶加載)的圖片
有2中方法采集延時加載的圖片
- 分析HTML代碼,找出原始圖片地址。 一般圖片地址都存在類似
data-src
,或者data-orignal
這樣的標簽屬性中。 - 使用腳本命令中的滾動命令,模擬瀏覽器的滾動,使得圖片自動加載顯示。 然后在設置采集。