下面為大家詳細介紹趕集網批量生成網址的采集方法(生成網址參數+列表數據)
采集網站:http://sh.ganji.com/fang5
采集內容:趕集網批量生成網址后,二手房列表數據的采集
采集字段:樓盤名稱、樓層、戶型、面積、朝向,價格、是否裝修等
第一步:新建任務
進入主頁,選擇“新建任務”輸入需要采集的網址。 選中網址關鍵詞“sh”,這時會彈出生成網址參數窗口, 選中“列表”,輸入多個關鍵詞以英文逗號,分割即可生成批量網址
第二步:抓取數據
采集器自動識別批量生成網址列表數據
可以根據需求自定義添加刪除字段,分頁設置/自動識別分頁
第三步:設置
根據需要,自定義設置,可以大大提高加載速度及工作效率。
第四步:加載數據
任務列表中:選中任務/點擊開使
可以看到加載的進程,速度是非??斓?
第五步:查看保存數據
任務列表中:選中任務/點擊查看
可以預覽剛加載的數據,并導出數據
選擇合適的保存格式
下面是我們剛保存的Excel表格