這篇文章將給大家介紹,如何使用爬山虎采集器來采集一點資訊新聞文章。
首先,下載爬山虎采集器,安裝完成之后打開軟件。
在軟件起始頁的簡易采集,點擊開始使用
然后點擊新聞媒體分類,找到一點資訊新聞文章,點擊進入
然后點擊立即使用,來使用這個采集規則。進入到這個采集規則后,我們需要設置要采集的一點資訊頻道地址,這里我們演示采集娛樂,http://www.yidianzixun.com/channel/c3 ,其他頻道地址,用戶可以自己從一點資訊上復制過來。
點擊開始采集后,爬蟲軟件就可以自動開始采集,其中采集的內容包含 標題、鏈接、時間、作者、評論數量、內容這些字段。
爬蟲的實時采集狀態
一點資訊默認瀑布流式的更新方式,每次采集數量大約50條左右,這是不斷更新的。第二次采集時,又會采集到新的內容。