本文介紹使用爬山虎采集器,批量采集豆瓣電影短評數據,根據模板提示,輸入搜索(電影)后網址,一鍵即可采集。
采集網站:https://movie.douban.com/subject/1291543/comments?status=P
第一步:下載爬山虎采集器,安裝完成之后打開軟件
簡易采集/找到對應的模板,也跟根據關鍵搜索查找。
第二步:預覽模板的采集字段和示例數據,立即使用
進入規則后,根據提示,輸入搜索(電影)后的網址,開使采集
通過日志可以看出加載的進程,可見,爬山虎采集器速度是非常的快
點擊數據,可以預覽正在加載的內容
第三步:查看保存數據
任務列表中:選中任務/點擊查看 ,導出數據