第一步:輸入網址
采集器沒有自動識別到子頁面鏈接,F12查看網頁元素,找到對應的鏈接屬性:"onclick"
第二步:添加字段,右鍵字段:設置取值屬性輸入:"onclick"
右鍵字段:手動設置xpath,“.“ 選取當前節點
右鍵數據處理:新建/正則匹配
觀察網站地址,點擊不同子頁面鏈接,地址前部分是不變的
右鍵數據處理:新建/添加前后綴
網址已經全部拼好了
爬山虎采集器“深入鏈接”命令已彈出 選中鏈接,深入此鏈接
按所需選擇子頁內容,一個詳情頁鏈接就構造完成了。
第一步:輸入網址
采集器沒有自動識別到子頁面鏈接,F12查看網頁元素,找到對應的鏈接屬性:"onclick"
第二步:添加字段,右鍵字段:設置取值屬性輸入:"onclick"
右鍵字段:手動設置xpath,“.“ 選取當前節點
右鍵數據處理:新建/正則匹配
觀察網站地址,點擊不同子頁面鏈接,地址前部分是不變的
右鍵數據處理:新建/添加前后綴
網址已經全部拼好了
爬山虎采集器“深入鏈接”命令已彈出 選中鏈接,深入此鏈接
按所需選擇子頁內容,一個詳情頁鏈接就構造完成了。