爬山虎采集器支持多個格式的數據導出(發布),包括TXT、CSV、Excel、Access、MySQL、SQLServer、SQLite以及發布到網站接口(Api)。
導出方式有2種:
- 手動導出,通過
右擊任務
->導出任務
,或者是在查看數據
中導出。 - 自動導出,在編輯任務的第三步中設置導出。
在數據導出后,會被標記為已導出,在下次導出時,不會再導出。 如果想要導出全部數據,而不區分已導出,可以在查看數據
中選擇導出全部
。
導出到Excel、CSV、TXT
可以將數據導出到Excel、CSV、TXT文件中,每次導出將會生成新的文件。
軟件支持對導出的文件名設置變量,目前有2種格式變量,按照任務名
和日期格式
。
導出TXT支持一條記錄保存為一個文件??梢愿鶕侄沃祦矶x文件名稱,導出的內容格式也可以自定義模板
如需導出到.html文件格式,只需要將導出保存的文件名后綴.txt
修改為.html
。
在最新版本v3.0中,導出CSV、TXT時,如果設置的導出文件已經存在,則導出數據時,在原有文件后追加內容,不會覆蓋原來的數據。
導出到網站接口(API)
支持主流CMS網站系統,比如Discuz、帝國CMS、Wordpress、DEDE CMS、PHP CMS,官方可以提供接口文件(API)。
對于開發人員,可以自己定義網站API,爬山虎采集器的通過HTTP POST請求將數據發送指定的API,設置對應的POST(application/x-www-form-urlencoded)參數、編碼類型即可
POST示例參考
POST http://www.example.com HTTP/1.1
Content-Type: application/x-www-form-urlencoded;charset=utf-8
title=example_title&content=example_content&channel=2
導出到數據庫
目前采集器支持導出到MySQL、SQLServer、SQLite、Access四種數據庫,設置好數據庫的連接配置,指定導出的目標表名稱。
同時,可以設置本地的任務字段與目標數據庫字段之間的映射關系(對應關系)
數據庫的字段映射設置