本文介紹如何使用爬山虎采集器,采集大眾點評網酒店評價信息,操作流程如下: (注:簡易采集/生活服務里有對應的規則模板)
第一步:下載爬山虎采集器,安裝完成之后打開軟件
在軟件起始頁的“自定義采集”或者直接“新建”,輸入網址;本站如需采集更多信息,需要登錄。
第二步:抓取數據
采集器自動識別列表,但是數據不是我們需要的,清空全部
執行“進入編輯腳本模式”,點擊“查看更多評論”,返回數據列表
(注:進入腳本模式后,操作跟正常瀏覽網頁操作一樣)
選擇列表模式(評論部分是一個列表)
分頁設置/手動識別分頁(部分網站,分頁自動識別不了就手動識別)
第三步:加載查看并導出數據
任務列表中:選中任務/右鍵/開始采集
通過日志,可以看到加載的進程
點擊數據按鈕,可直接預覽數據
任務列表中:選中任務/點擊查看 ,導出數據