天天色天天操综合,亚洲美女尤物影院,欧美xxxx黑人又粗又长,√8天堂资源地址中文在线

網頁數據抓取之自動分類功能

2016-09-10 14:17:52 瀏覽:8108

我們在使用火車采集器進行數據抓取的時候,會需要將采集內容包含某個字的所有內容都替換為某個固定的內容。使用場景如:我們從網站采集城市名稱,然后城市名稱示例:浙江省杭州市,我們需要將這個內容替換為杭州,這時就可以使用自動分類功能。

下面以百度為例介紹下用法,首先在火車采集器V9建立規則,內容采集規則的標簽編輯如下:

1.png

 

如上圖,我們想要將包含百度的標題 內容更替換為常用搜索網站,則寫成如下格式:

2.png

 

運行結果為:

3.png

 

就是數據抓取時將某字段所有內容自動分類的使用方法,在操作需要注意的是

1一行一個分類,可以寫多個分類。若是一個關鍵詞符合多個分類,則優先替換上面的分類,火車采集器中是按照從上至下的原則替換。

2若是所有分類不符合的情況下,你想要將關鍵詞賦予為一個默認值,按下圖操作:

 

4.png


學會數據抓取的自動分類操作,對包含同類字段的內容進行分類就方便多了,大家也操作試試吧。

掃碼關注微信
主站蜘蛛池模板: 天镇县| 巨鹿县| 沾益县| 姜堰市| 花垣县| 锡林浩特市| 巨野县| 湖口县| 景泰县| 临颍县| 瓦房店市| 毕节市| 志丹县| 图木舒克市| 临桂县| 诸城市| 屯昌县| 稻城县| 登封市| 大安市| 景谷| 曲阳县| 牟定县| 西安市| 万载县| 马边| 叙永县| 且末县| 上栗县| 错那县| 金坛市| 武隆县| 铜川市| 克什克腾旗| 广西| 江阴市| 岱山县| 福泉市| 湖南省| 南部县| 郓城县|