天天色天天操综合,亚洲美女尤物影院,欧美xxxx黑人又粗又长,√8天堂资源地址中文在线

速看|火車采集器V9.11版本更新

2019-11-21 17:09:33 瀏覽:6291


親愛(ài)的用戶:

為了給用戶更好的采集體驗(yàn),2019年11月21日我們進(jìn)行了火車采集器的版本更新,目前火車采集器V9.11版本已正式上線。



1、★ 列表頁(yè)新增“地址處理”功能

示例網(wǎng)址,新浪滾動(dòng)新聞:https://news.sina.com.cn/roll/#pageid=153&lid=2509&k=&num=50&page=1

點(diǎn)擊下一頁(yè),抓包可獲取真實(shí)地址:

        https://feed.mix.sina.com.cn/api/roll/get?pageid=153&lid=2509&k=&num=50&page=1


分析json數(shù)據(jù)可以得知 url 后面的是內(nèi)容頁(yè)網(wǎng)址,設(shè)置如下:

          QQ截圖20191121171005.png      

 


可以看到采集的網(wǎng)址里有很多 \ ,導(dǎo)致網(wǎng)址無(wú)法訪問(wèn),而且網(wǎng)址不規(guī)則,不易處理。

    

QQ截圖20191121171039.png

這種可以使用新增的“地址處理”功能

內(nèi)容替換/排重

   可以對(duì)網(wǎng)址中內(nèi)容進(jìn)行替換,且替換完成后,重復(fù)的網(wǎng)址會(huì)自動(dòng)去重。



QQ截圖20191121171059.png

QQ截圖20191121171117.png



純正則替換

  可以使用正則表達(dá)式進(jìn)行匹配,和內(nèi)容替換功能類似

字符編碼處理

  網(wǎng)址中有需要轉(zhuǎn)碼的內(nèi)容,比如采到的鏈接里有 & 可以進(jìn)行解碼

         https://feed.mix.sina.com.cn/api/roll/get?pageid=153&lid=2509&k=&num=50&page=1

QQ截圖20191121171137.png

2、★新增“請(qǐng)求失敗數(shù)”的預(yù)警條件設(shè)置



3、★下載圖片命名,新增[記錄自增Id]格式

記錄自增ID:同一個(gè)內(nèi)容頁(yè)中,多個(gè)標(biāo)簽設(shè)置記錄自增ID,那么多個(gè)標(biāo)簽都是從1開(kāi)始自增,再次測(cè)試運(yùn)行又會(huì)重新開(kāi)始從1自增,更換個(gè)內(nèi)容頁(yè)測(cè)試運(yùn)行,也是從1開(kāi)始自增。

自增ID:設(shè)置自增ID是采集器啟動(dòng)后運(yùn)行,開(kāi)始一個(gè)自增ID,從1開(kāi)始自增,之后就是自增。重啟采集器后,又會(huì)重新開(kāi)始自增ID,從1開(kāi)始自增。

舉例說(shuō)明:自增記錄ID:縮略圖和內(nèi)容兩個(gè)標(biāo)簽都有圖片下載,都設(shè)置了記錄自增ID。

QQ截圖20191121171159.png

QQ截圖20191121171222.png

比如內(nèi)容頁(yè)網(wǎng)址https://zhishi.fang.com/jiaju/qg_680673.html

QQ截圖20191121171240.png

更換一個(gè)內(nèi)容頁(yè)網(wǎng)址,記錄自增ID還是從1開(kāi)始自增。

https://zhishi.fang.com/jiaju/qg_691372.html

QQ截圖20191121171259.png

自增ID:內(nèi)容標(biāo)簽中設(shè)置了自增ID。

QQ截圖20191121171318.png

之后就會(huì)一直自增。

QQ截圖20191121171337.png

想要自增ID再次從1開(kāi)始,需要重啟采集器,那么就會(huì)從1開(kāi)始了,否則只要設(shè)置了自增ID的,都會(huì)一直自增下去


4、★修復(fù)圖片下載誤判斷問(wèn)題


5、★修復(fù)計(jì)劃任務(wù)中“每天調(diào)度”,起始運(yùn)行時(shí)間配置未生效的問(wèn)題


6、★ 修復(fù)PHP插件,對(duì)于循環(huán)記錄的處理報(bào)錯(cuò)的問(wèn)題


7、★修復(fù)拼音首字母對(duì)于一些錯(cuò)誤字符的判斷問(wèn)題


8、★任務(wù)批量編輯,修復(fù)“發(fā)布”中“多網(wǎng)站亂序發(fā)布”未能復(fù)制的問(wèn)題


9、★修改“循環(huán)添加新記錄”配置后,修復(fù)數(shù)據(jù)格式選擇錯(cuò)誤的問(wèn)題★


10、★修復(fù)循環(huán)記錄中列表頁(yè)標(biāo)簽被多次處理的問(wèn)題★


11、★修復(fù)對(duì)于一些302跳轉(zhuǎn)地址,無(wú)法正確跳轉(zhuǎn)的問(wèn)題★


12、★修復(fù)一些網(wǎng)址無(wú)法正確請(qǐng)求的問(wèn)題★



感謝用戶的支持與使用,今后也請(qǐng)多多支持小采~






掃碼關(guān)注微信
主站蜘蛛池模板: 文登市| 韶山市| 浑源县| 石阡县| 蚌埠市| 娄烦县| 渑池县| 交城县| 葵青区| 邛崃市| 西峡县| 临汾市| 平舆县| 丹阳市| 华容县| 新源县| 登封市| 上林县| 北京市| 文水县| 永清县| 南靖县| 丰城市| 蓝山县| 兖州市| 昭通市| 贵港市| 盐源县| 枣阳市| 邹平县| 土默特右旗| 剑阁县| 南郑县| 安远县| 稷山县| 邵东县| 晋州市| 甘南县| 高陵县| 西乌| 凌源市|