下面為大家詳細介紹博客園數據的采集方法(列表數據+內容頁)
采集網站:https://home.cnblogs.com/kb/
采集內容:博客園列表數據+內容頁
采集字段:標題、簡介、瀏覽量、推薦、作者、發布時間及標題內頁文章等
第一步:新建任務
進入主頁,選擇“新建任務”輸入需要采集的網址。
第二步:抓取數據
采集器自動識別列表數據(可以根據需求自定義添加刪除字段)
需要抓取標題對應的內容頁:選標題鏈接/深入此鏈接
彈出標題內頁:單條列表模式/添加字段(可以根據需求自定義添加字段)
第三步:加載數據
任務列表中:選中任務/點擊開使
可以看到加載的進程
第四步:查看保存數據
任務列表中:選中任務/點擊查看
可以預覽剛加載的數據,并導出數據