在之前文檔中有下載單圖片的介紹,參考下載圖片
那么如果遇到一篇文章中有多張圖片,或者是一個圖集形式的,如何下載呢?
有2種方式可以實現:
- 直接采集包含多張圖片元素(img)的內容HTML(取值屬性設為 InnerHTML或 OuterHTML)
- 通過手動編寫 XPath,選擇多張圖片元素(取值屬性設為 src)
然后設置'文件下載'
關于第二種方式,如何選擇編寫 XPath 以獲取多張圖片元素呢?
比如有2張圖片XPath:
/li[1]/img[1]
/li[1]/img[2]
那么我們需要的XPath就是:
/li[1]/img
如果2張圖片XPath如下:
/li[1]/img[1]
/li[2]/img[1]
那么我們需要的XPath就是:
/li/img[1]/