一般情況下,在爬山虎采集器中,通過鼠標點擊,選擇要抓取的內容。 但是在一些情況下,比如要抓取一篇文章的完整內容時,內容較長時,鼠標有時就不好定位了。
-
我們可以通過
右擊網頁
->檢查元素
,來定位內容。 -
通過點擊“向上”按鈕,擴大選擇的內容。
-
當擴大到我們的整篇內容時,全選中XPath,然后復制。
-
修改字段的XPath,把剛才復制的XPath粘貼進去,確定。
-
最后,修改
取值屬性
,想要HMTL就使用InnerHTML
或者OuterHTML
。
一般情況下,在爬山虎采集器中,通過鼠標點擊,選擇要抓取的內容。 但是在一些情況下,比如要抓取一篇文章的完整內容時,內容較長時,鼠標有時就不好定位了。
我們可以通過右擊網頁
->檢查元素
,來定位內容。
通過點擊“向上”按鈕,擴大選擇的內容。
當擴大到我們的整篇內容時,全選中XPath,然后復制。
修改字段的XPath,把剛才復制的XPath粘貼進去,確定。
最后,修改取值屬性
,想要HMTL就使用InnerHTML
或者OuterHTML
。