列表模式 ,顧名思義,就是針對包含多條數據記錄的頁面,我們一般稱為列表頁。
比如百度、谷歌的搜索結果頁面,就是一個典型的列表頁。 如果我們想要從這種頁面提取出多條結構相同的數據,我們就要選擇列表模式。
單條模式,就是僅采集一行數據記錄。
這種模式用于采集內容頁。比如一般博客、新聞網站的內容頁,或者叫詳情頁面。
字段 XPath在列表和單條模式下的區別
列表模式下,字段是在列表中的一個節點中進行匹配,XPath 是以./
開頭,表示當前節點的意思。而單條模式時,字段是在整個頁面中進行匹配的。
如何設置列表:
- 自動識別列表,當新建任務,輸入起始網址后,程序會自動識別頁面中的列表數據,并且生成數據字段。
-
手動選擇列表,當自動識別的結果不是想要的數據時,我們可以手動選擇列表數據。 具體參考 如何手動選擇列表