本文介紹爬山虎采集器采集【尋醫問藥】網,有問必答相關數據的采集,。 操作流程如下:
第一步:下載爬山虎采集器,安裝完成之后打開軟件
在軟件起始頁的“自定義采集”或者直接“新建”,輸入網址
第二步:抓取數據
采集器自動識別列表,分頁設置:自動識別分頁(可能過添加字段,自定義增添列,修改表頭名稱)
選中鏈接列,深入鏈接(需要采集子頁內容)
添加字段,根據提示,選取需要采集的內容,下一步直至完成
第三步:加載數據
任務列表中:選中任務/右鍵/開始采集
通過日志,可以看到加載的進程
點擊數據按鈕,直接預覽正在加載的數據
第四步:查看保存數據
任務列表中:選中任務/點擊查看 ,導出數據