這篇文章將給大家介紹如何使用爬山虎采集器來自己自媒體的爆文文章。
首先下載爬山虎采集器,安裝完成之后打開軟件。
在軟件起始頁的簡易采集,點擊開始使用
然后點擊新聞媒體分類,找到今日頭條首頁新聞采集,點擊進入
然后點擊立即使用,來使用這個采集規則。
進入到這個采集規則后,我們需要設置要采集的頭條分類地址,默認是首頁 https://www.toutiao.com/ 這里我們演示采集熱點,https://www.toutiao.com/ch/news_hot/
點擊開始采集后,軟件就會自動采集頭條的爆文文章,包含 標題、鏈接、作者、評論數量、內容、時間這些字段。
采集完成之后,我們可以點擊查看數據,檢查下文章內容。默認采集的文章是HTML格式,這樣發布到網站后,可以保持原來的排版。