本文介紹爬山虎采集器,按關鍵搜索,批量采集天涯論壇發帖信息。本案例采集關鍵詞“文學”。
第一步:下載爬山虎采集器,安裝完成之后打開軟件。
在軟件起始頁的簡易采集,點擊開始使用
然后點擊分類“其它”,找到對應的模板,也可以根據關鍵詞搜索,點擊進入
第二步:預覽模板的采集字段和示例數據,立即使用。
如需編輯模板,點擊此處詳見此文:
進入規則后,根據提示,輸入需要采集的關鍵詞,本案例關鍵詞:“文學”
開始采集后,通過日志,可以看到加載的進程,爬山虎爬取速度是非??斓?
第三步:查看保存數據
任務列表中:選中任務/查看數據
導出數據,選擇合適的格式導出數據