Editor Tools自設(shè)計(jì)初期就以提升軟件自動(dòng)化水平為核心目標(biāo),為了實(shí)現(xiàn)無(wú)需人工干預(yù)、全天候自動(dòng)運(yùn)行。經(jīng)實(shí)際驗(yàn)證,Editor Tools能夠長(zhǎng)期穩(wěn)定工作,即便以年為單位持續(xù)運(yùn)行也表現(xiàn)可靠。這款免費(fèi)自動(dòng)化采集工具獨(dú)立于網(wǎng)站系統(tǒng)運(yùn)行,不占用服務(wù)器寶貴的Web處理資源,就可以部署于服務(wù)器環(huán)境,也可以在管理員本地計(jì)算機(jī)上操作。

縮略圖抓取方法
在ET中,用戶(hù)就可以從列表頁(yè)抓取縮略圖,也可從內(nèi)容頁(yè)獲取縮略圖資源。
一、從列表頁(yè)獲取縮略圖
1、列表頁(yè)中的縮略圖通常用于文章預(yù)覽,可在列表分析環(huán)節(jié)通過(guò)“縮略圖標(biāo)記”進(jìn)行抓取

添加標(biāo)記后

2、隨后在“縮略圖數(shù)據(jù)項(xiàng)”中配置相關(guān)參數(shù)。需要注意的是,在ET2版本中,當(dāng)“縮略圖數(shù)據(jù)項(xiàng)”的采集規(guī)則為空時(shí),其取值將自動(dòng)采用列表分析中“縮略圖標(biāo)記”的抓取結(jié)果。ET3版本則默認(rèn)通過(guò)指定模式,選擇數(shù)據(jù)項(xiàng)“列表縮略圖”(即列表分析中“縮略圖標(biāo)記”的抓取結(jié)果)作為縮略圖來(lái)源。

由于抓取到的縮略圖一般為圖片地址,需在文件選項(xiàng)中勾選“作為文件網(wǎng)址”。
3、接著配置文件下載設(shè)置

4、最后,務(wù)必在發(fā)布設(shè)置的發(fā)布項(xiàng)窗口中通過(guò)數(shù)據(jù)項(xiàng)標(biāo)記為網(wǎng)站縮略圖參數(shù)賦值方能生效

(圖示以WordPress為例,litpic為其縮略圖參數(shù)名稱(chēng),其他系統(tǒng)參數(shù)請(qǐng)參閱接口文檔)
5、ET3支持多層列表結(jié)構(gòu),在多層列表中使用“縮略圖標(biāo)記”時(shí),將以最后一次使用該標(biāo)記的抓取結(jié)果作為“縮略圖數(shù)據(jù)項(xiàng)”的最終值

二、從內(nèi)容頁(yè)獲取縮略圖
1、列表分析時(shí)不使用“縮略圖標(biāo)記”
2、需為“縮略圖數(shù)據(jù)項(xiàng)”設(shè)置采集規(guī)則

3、在采集頁(yè)設(shè)置中,將“縮略圖數(shù)據(jù)項(xiàng)”與目標(biāo)網(wǎng)頁(yè)關(guān)聯(lián)

4、其余步驟與從列表抓取方式一致
軟件功能
1、方案配置完成后即可全天候自動(dòng)工作,無(wú)需人工參與
2、通過(guò)獨(dú)立開(kāi)發(fā)的接口與網(wǎng)站分離,兼容各類(lèi)網(wǎng)站系統(tǒng)及數(shù)據(jù)庫(kù)
3、靈活強(qiáng)大的采集規(guī)則不僅可抓取文章,還能收集各類(lèi)結(jié)構(gòu)化信息
4、體積小巧、資源占用低且運(yùn)行穩(wěn)定,非常適合服務(wù)器環(huán)境部署
5、所有規(guī)則支持導(dǎo)入導(dǎo)出,方便資源靈活復(fù)用
6、采用FTP方式進(jìn)行文件傳輸,穩(wěn)定可靠
7、下載與上傳過(guò)程支持?jǐn)帱c(diǎn)續(xù)傳
8、具備高速內(nèi)容重構(gòu)能力
軟件特色
1、支持按倒序、順序及隨機(jī)方式抓取內(nèi)容
2、具備自動(dòng)列表網(wǎng)址生成功能
3、可抓取數(shù)據(jù)分布在不同層級(jí)頁(yè)面的復(fù)雜網(wǎng)站
4、自由定義采集數(shù)據(jù)項(xiàng),并對(duì)每個(gè)數(shù)據(jù)項(xiàng)單獨(dú)過(guò)濾處理
5、支持分頁(yè)內(nèi)容抓取
6、兼容各種格式的文件下載(包含圖片、視頻等多媒體資源)
7、可處理防盜鏈限制的文件資源
8、支持動(dòng)態(tài)文件地址解析
9、能夠抓取需要登錄才能訪(fǎng)問(wèn)的頁(yè)面內(nèi)容
10、支持關(guān)鍵詞定向采集
11、可設(shè)置敏感詞過(guò)濾機(jī)制
12、具備圖片水印添加功能
軟件亮點(diǎn)
1、支持發(fā)布含回復(fù)內(nèi)容的文章,適用于論壇、博客等多種平臺(tái)
2、采用與采集數(shù)據(jù)分離的發(fā)布參數(shù)項(xiàng),可自由匹配采集數(shù)據(jù)或預(yù)設(shè)值,極大提升發(fā)布規(guī)則復(fù)用性
3、支持隨機(jī)選擇發(fā)布賬戶(hù)
4、支持任意發(fā)布項(xiàng)的語(yǔ)言翻譯功能
5、支持編碼轉(zhuǎn)換與UBB代碼處理
6、文件上傳時(shí)可自動(dòng)按年月日創(chuàng)建目錄結(jié)構(gòu)
7、通過(guò)模擬發(fā)布功能可向未安裝接口的網(wǎng)站推送內(nèi)容
8、支持方案定時(shí)執(zhí)行
9、具備防HTTP劫持功能
10、支持手動(dòng)單項(xiàng)目采集與發(fā)布
11、提供詳細(xì)的工作流程監(jiān)控與信息反饋,實(shí)時(shí)掌握運(yùn)行狀態(tài)
版本更新
v3.7 更新內(nèi)容
1、新增:采集配置中增加了主列表網(wǎng)址的HTTP Header請(qǐng)求頭設(shè)置項(xiàng)
2、優(yōu)化:采集配置中的主列表網(wǎng)址、下級(jí)網(wǎng)址、多層列表網(wǎng)址及采集頁(yè)網(wǎng)址均支持新版POST提交格式,更好地兼容POST表單參數(shù)和JSON參數(shù)。原"POST優(yōu)先模式"不再推薦使用,具體用法請(qǐng)參閱幫助文檔
3、優(yōu)化:恢復(fù)有道翻譯API支持(注:因該API轉(zhuǎn)為收費(fèi)服務(wù),需用戶(hù)自行注冊(cè)有道翻譯賬號(hào))
4、優(yōu)化:增強(qiáng)采集頁(yè)兼容性,現(xiàn)可用于調(diào)用第三方網(wǎng)站的API接口