如何下載圖片?

  1. 點擊添加字段。
  2. 鼠標點擊網頁中的圖片,程序自動獲取圖片地址。(已有字段,選擇重新選擇元素,然后點擊圖片) download
  3. 選擇要下載的字段,點擊菜單按鈕,選擇文件下載菜單。

    download

  4. 設置文件名和圖片的保存路徑。。

    download

  5. 完成


關于自定義文件名

在爬山虎采集器中,可以使用一些自定義變量來命名文件名,比如任務名稱、時間格式、隨機字符、以及使用字段值來命名。這些之間可以自由組合。 download


關于自定義目錄

在文件名中加入字符/,就可以生成目錄。 比如設置文件名為 {title}/{原文件名} 就會自動創建{title}目錄,然后以原文件名保存。


關于替換內容地址

如果采集的內容是要發布到網站上面,有下載圖片的話,那就需要使用替換內容地址。

把內容中的原網站圖片地址替換為本地的相對地址,發布到網站后,在使用FTP軟件把圖片批量上傳到網站目錄,這樣網頁才會正常顯示。

(一般網站都會對圖片進行防倒鏈處理,禁止第三方網站直接引用)

如何下載多張圖片

下載多張圖片,我們需要修改圖片XPath,來匹配多張圖片。 具體XPath如何編寫 參考


如何下載文章HTML內的多張圖片

采集新聞、文章內容時,如果內容中包含圖片,我們需要采集文章的HTML形式,設置取值屬性InnerHTML或者OuterHTML。 然后直接設置下載即可,程序會自動檢測內容中IMG標簽,并且下載圖片。


延時加載(懶加載)的圖片

有2中方法采集延時加載的圖片

  1. 分析HTML代碼,找出原始圖片地址。 一般圖片地址都存在類似data-src,或者data-orignal這樣的標簽屬性中。
  2. 使用腳本命令中的滾動命令,模擬瀏覽器的滾動,使得圖片自動加載顯示。 然后在設置采集。