下面為大家詳細介紹根據關鍵詞采集數據的方法(列表數據+搜索關鍵詞+內容頁)
采集網站:http://www.gxstzy.cn/index/tzxw/tzgg.htm
采集內容:列表頁+搜索關鍵詞+內容頁
采集字段:關鍵詞內容頁
第一步:新建任務,進入主頁,選擇“新建任務”輸入需要采集的網址。
第二步:抓取數據
采集器自動識別列表數據 自動識別分頁(需要采集多頁數據)
點擊標題列/右鍵/高級過濾(可以根據需求自定義添加刪除字段,修改名稱等)
必須包含
輸入關鍵詞:教學儀器設備,添加確定即可
可以看到,不包含關鍵詞的名稱已刪除,需要采集多頁:自動識別分頁
選中鏈接/深入此鏈接(需要采集關鍵詞的內容頁)
添加字段/點擊選中全文
第三步:設置
根據需要,自定義設置,可以大大提高加載速度及工作效率。
第四步:加載數據
任務列表中:選中任務/點擊開使
可以看到加載的進程 (點擊數據也可以查看剛加載的數據)
第五步:查看保存數據
任務列表中:選中任務/點擊查看
可以預覽剛加載的數據,并導出數據
特殊情況 :編輯內容,可以預覽全部數據(修改后統一下載 )