火車(chē)頭采集器v9.4下載 免費版 【附教程】
優(yōu)采云 發(fā)布時(shí)間: 2020-04-23 11:04火車(chē)頭采集器v9破解版是一款老牌的內容采集工具了,不少原先的站長(cháng)都喜歡使用火車(chē)頭采集器進(jìn)行指定內容的采集操作,火車(chē)頭采集器為用戶(hù)提供了分布式高速采集技術(shù),可以同時(shí)運行多個(gè)任務(wù)進(jìn)行采集操作,擁有手動(dòng)編碼辨識、中文動(dòng)詞辨識和正文辨識等功能,免去了自動(dòng)配置規則的麻煩,同時(shí)還擁有強悍的反義詞替換功能,可以使你的內容愈加豐富、專(zhuān)業(yè),不過(guò)小編須要提醒你們的是就是火車(chē)頭采集器v9是最新版本,目前暫無(wú)破解版本,小編為你們提供的是官方版本,大家可以先試用一下,同時(shí)還包含了基本的操作教程供你們參考。
分布式高速采集
任務(wù)分配至多個(gè)客戶(hù)端,同時(shí)運行采集,效率倍增。
多辨識系統
配備正文辨識、中文動(dòng)詞辨識、任意編碼辨識等多種辨識系統,智能辨識操作更輕松。
可選驗證方法
可選擇是否使用加密狗,隨時(shí)保障數據安全。
全自動(dòng)運行
無(wú)需人工值守操作,任務(wù)完成后自動(dòng)關(guān)機。
替換功能
同義,近義詞替換、參數替換,偽原創(chuàng )必備技能。
任意文件格式下載
圖片、壓縮文件、視頻等任意格式的文件都能輕松下載。
采集監控系統
實(shí)時(shí)監控采集,確保數據的準確性。
支持多數據庫
支持Access/MySQL/MsSQL/Sqlite/Oracle多種類(lèi)型的數據庫保存及發(fā)布。
無(wú)限級多頁(yè)采集
支持包含ajax懇求數據在內的多個(gè)頁(yè)面信息的無(wú)限級采集。
支持擴充
支持插口和插件擴充,滿(mǎn)足各類(lèi)采發(fā)需求。
1.新建分組
新建一個(gè)任務(wù)分組,選擇所屬分組,確定分組名稱(chēng)和備注。
2.新建任務(wù)
確定所屬分組,新建一個(gè)任務(wù),填寫(xiě)任務(wù)名稱(chēng)并保存。
3.Web發(fā)布配置
Web發(fā)布配置定義了怎樣登錄一個(gè)網(wǎng)站以及向該網(wǎng)站提交數據。
主要涉及到登陸信息的獲取,網(wǎng)站編碼設定,欄目列表的獲取,以及使用數據測試發(fā)布療效。
詳細教程后續分解。
4.Web發(fā)布模塊
可以定義網(wǎng)站登錄,獲取欄目列表,獲取網(wǎng)頁(yè)隨機值,內容發(fā)布參數,以及上傳文件,構造發(fā)布數據等中級功能。
詳細教程后續分解。
5.數據庫發(fā)布配置
數據庫發(fā)布配置定義了數據庫鏈接信息的設置以及數據庫模塊的選擇。
詳細教程后續分解。
6.數據庫發(fā)布模塊
用于編輯數據庫的發(fā)布模塊,方便我們將數據發(fā)布到配置好的數據庫中。
火車(chē)采集器可選mysql、sqlserver、oracle、access四種數據庫類(lèi)型,在文本輸入框中填寫(xiě)sql句子
(需有數據庫相關(guān)知識),并可使用標簽替換相應數據。也可在采集器模塊文件夾中加載某一模塊進(jìn)行編輯。
詳細教程后續分解。
7.計劃任務(wù)
設置列表中采集任務(wù)的啟動(dòng)計劃,可每間隔、每天、每周、僅一次、或自定義Cron表達式火車(chē)頭采集教程,
(Cron表達式的寫(xiě)法可參考相關(guān)術(shù)語(yǔ)中的介紹)。保存設置后,任務(wù)即可根據設置執行。
詳細教程后續分解。
8.插件管理
插件是可以拿來(lái)擴充列車(chē)采集器功能的程序
火車(chē)采集器V9支持PHP源碼、C#源碼、C#泛型三種類(lèi)型的插件,
可用于擴充http請求、內容處理和文件下載的功能,并可以分別進(jìn)行測試。
詳細教程后續分解。
9.http二級代理
網(wǎng)絡(luò )中的代理服務(wù)器,可以代理網(wǎng)路用戶(hù)去取得所須要的網(wǎng)路信息。
代理的功能有可以突破自身ip的訪(fǎng)問(wèn)限制訪(fǎng)問(wèn)美國站點(diǎn),訪(fǎng)問(wèn)一些單位或團體內部資源,
突破聯(lián)通的ip封鎖和隱藏真實(shí)的ip等。
火車(chē)采集器V9支持http代理、socket4和socket5代理。
詳細教程后續分解。
10.http模擬懇求
可以設置怎么發(fā)起一個(gè)http請求,包括設置懇求信息,返回頭信息。并具有手動(dòng)遞交的功能。
1.任務(wù)批量編輯
批量更改任務(wù)規則細節參數
2.任務(wù)批量處理
按照以下選項批量清除或導出數據。
3.遠程管理
該功能可以通過(guò)http協(xié)議來(lái)對服務(wù)器上的采集器進(jìn)行遠程管理。
換言之,我們可以通過(guò)瀏覽器訪(fǎng)問(wèn)到我們的采集器來(lái)進(jìn)行管理。
點(diǎn)擊啟動(dòng)后如圖:
訪(fǎng)問(wèn)地址后進(jìn)行常用操作管理:
4.用戶(hù)管理
該功能容許用戶(hù)將自己寫(xiě)好的采集規則共享給一個(gè)或多個(gè)客戶(hù)端用戶(hù)。
可以通過(guò)服務(wù)器用戶(hù)管理設置用戶(hù)賬號,用來(lái)限定用戶(hù)下載規則的權限和容許用戶(hù)訪(fǎng)問(wèn)的分組。
客戶(hù)端用戶(hù)可以下載遠程的采集規則火車(chē)頭采集教程,并可以有選擇地更新任務(wù),還可以一鍵更新所有遠程的采集規則。
該功能對于一些非技術(shù)顧客而言市去了寫(xiě)規則的麻煩,也幫助開(kāi)辦規則服務(wù)器的用戶(hù)省去了遠程指導的環(huán)節。
5.運行統計
用于統計用戶(hù)運行的任務(wù),可以以天、周、月或選擇的時(shí)間段來(lái)查詢(xún),
包括采集到的網(wǎng)址、重復網(wǎng)址、采集成功、采集失敗、發(fā)布成功、發(fā)布失敗等數據。
6、同義詞替換
此功能可以將采集內容中的詞句進(jìn)行替換,自定義替換規則。
但需注意:兩個(gè)同義詞之間要用英語(yǔ)全角頓號聯(lián)接,比如將快樂(lè )替換成高興,即如下圖:
“快樂(lè ),高興” “美麗,漂亮”,然后保存,即可在數據處理中選擇對應詞庫使用替換功能。
7.中文動(dòng)詞
用來(lái)測試英文動(dòng)詞以及關(guān)鍵詞提取的療效。
可通過(guò)編輯用戶(hù)詞庫,設置時(shí)態(tài),詞頻,允許詞,禁用詞,來(lái)影響最終療效
8.數據轉換
數據采集下來(lái)后可選擇保存到sqlite、mysql、sqlserver三種類(lèi)型的數據庫中。
默認保存為sqlite數據庫,可轉換為其他類(lèi)型,其中sqlite是可以保存在本地數據庫的。
mysql、sqlserver既可以保存在本地數據庫,也可以保存到遠程數據庫。
9.選項
可對全局選項、采集設置、配置備份和使用偏好等進(jìn)行設置。
10.運行完自動(dòng)關(guān)機
如勾選該項,則在任務(wù)運行完畢后自動(dòng)關(guān)機。
1,批量網(wǎng)址更新,日期可以支持小于明天的數據。標簽可以采用多參數同步變化
2,標簽組合,增加對于循環(huán)組合的支持。
3,優(yōu)化網(wǎng)址庫排重邏輯,大大推動(dòng)大網(wǎng)址庫下的任務(wù)加載速率,優(yōu)化網(wǎng)址庫排重顯存占用。
4,數據庫發(fā)布模塊,增加“insert ignore”模式的支持
5, 新增任務(wù)的云端備份、同步功能
6,http遠程服務(wù)器,增加對于單條數據更改的API支持。
7,水印降低指定大小的壓縮功能
8,修復FTP,SFTP鏈接無(wú)法正確斷掉的問(wèn)題
9,修復Word2007未能保存圖片的問(wèn)題
10,修復標簽超長(cháng)時(shí)侯的顯示錯誤問(wèn)題。
11,修復標簽數據替換中的替換錯誤問(wèn)題。
12,修復了數據逆序發(fā)布的問(wèn)題。
13,優(yōu)化了幾個(gè)會(huì )導致采集器長(cháng)時(shí)間運行后顯存未能釋放的問(wèn)題。












