經過前幾課的學習,我們已經掌握了單條數據、列表數據、表格數據、能過列表頁鏈接進入詳情頁數據、實現不同類型的分頁等,完全可以成功的配置一個完整的采集規則了。
如何啟動采集并導出數據?
任務配置完成后,直接懶人式點擊下一步
即可啟動采集任務,爬山虎全自動的采集數據,選擇需要的格式導出或都上傳。
1.查看并預覽數據:
啟動本地采集,通過運行日志
可以查看采集進程,運行到哪一步,具體采集到哪一頁數據。
點擊數據
可以預覽已采集的數據
2、優化加速采集:
爬山虎第三步設置基本設置
中,針對網站情況,可以禁用彈窗``攔截廣告``禁用flash
等設置,優化并提高采集速度。
3、導出:
爬山虎采集器支持多個格式的數據導出(發布),包括TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及發布到網站接口(Api)等。
完整的采集流程如下:
通過以上幾節課學習,我們完全可以熟練的使用爬山虎來采集數據,并配置一條完整的采集規則,規則配置完成后,啟動采集并到導出所需的數據。