最新版:優(yōu)采云采集器 v2.1.8.0官方版下載
優(yōu)采云 發(fā)布時(shí)間: 2020-08-31 22:04優(yōu)采云采集器v2.1.8.0正式版下載
優(yōu)采云采集器是一款適合大多數網(wǎng)站W(wǎng)eb信息采集的軟件. 優(yōu)采云采集器可以實(shí)現智能識別,快速采集,并生成多種格式的數據輸出. ,以滿(mǎn)足您對指定網(wǎng)頁(yè)數據采集的需求.
軟件功能
1. 一鍵式數據提取: 簡(jiǎn)單易學(xué),您可以通過(guò)可視界面用鼠標單擊來(lái)獲取數據.
2. 快速高效: 內置一組高速瀏覽器內核以及HTTP引擎模式,以實(shí)現快速采集數據.
3. 適用于各種網(wǎng)站: 采集可以采集99%的Internet網(wǎng)站,包括單頁(yè)應用程序,Ajax加載和其他動(dòng)態(tài)類(lèi)型的網(wǎng)站.
4. 有許多類(lèi)型的導出數據. 您可以將數據從采集導出到Csv,Excel和各種數據庫,并支持api導出.
軟件功能
1. 向導模式: 易于使用,易于通過(guò)單擊鼠標自動(dòng)生成;
2. 腳本定期運行: 可以按計劃定期運行,無(wú)需人工;
3. 原創(chuàng )的高速內核: 自主開(kāi)發(fā)的瀏覽器內核,速度極快,遠遠超過(guò)對手;
4. 智能識別: 可以智能識別網(wǎng)頁(yè)中的列表和表單結構(多選框下拉列表等);
5. 廣告屏蔽: 自定義廣告屏蔽模塊,與AdblockPlus語(yǔ)法兼容,可以添加自定義規則;
6. 各種數據導出: 支持Txt,Excel,MySQL,SQLServer,SQlite,Access,網(wǎng)站等.
核心技術(shù)
1. 自動(dòng)識別列表數據,并通過(guò)智能算法一鍵提取數據;
2. 自動(dòng)識別尋呼技術(shù),智能識別算法,采集尋呼數據;
3. 混合瀏覽器引擎和HTTP引擎,同時(shí)考慮到易用性和效率.
使用方法
一個(gè): 輸入采集網(wǎng)址
打開(kāi)軟件,創(chuàng )建一個(gè)新任務(wù),然后輸入需要采集的網(wǎng)站地址.
二: 智能分析,在整個(gè)過(guò)程中自動(dòng)提取數據
進(jìn)入第二步后,優(yōu)采云采集器會(huì )自動(dòng)對網(wǎng)頁(yè)進(jìn)行智能分析,并從中提取列表數據.
三: 將數據導出到表,數據庫,網(wǎng)站等
運行任務(wù),將采集中的數據導出到表,網(wǎng)站和各種數據庫中,并支持api導出.
計算機系統要求
可以支持Windows XP以上的系統.
.Net 4.0 Framework,下載鏈接
安裝步驟
第一步: 打開(kāi)下載的安裝包,然后選擇直接運行它.
步驟2: 收到相關(guān)條款后,運行安裝程序PashanhuV2Setup.exe. 安裝
第3步: 然后繼續單擊“下一步”,直到完成為止.
步驟4: 安裝完成后,您可以看到優(yōu)采云采集器V2主界面的主界面
常見(jiàn)問(wèn)題解答
1. 如何采集移動(dòng)版網(wǎng)頁(yè)的數據?
在通常情況下,網(wǎng)站具有網(wǎng)頁(yè)的計算機版本和網(wǎng)頁(yè)的移動(dòng)版本. 如果對計算機版本(PC)網(wǎng)頁(yè)的反爬網(wǎng)非常嚴格,我們可以嘗試對移動(dòng)網(wǎng)頁(yè)進(jìn)行爬網(wǎng).
?、龠x擇創(chuàng )建新的編輯任務(wù);
?、谠谛聞?chuàng )建的[編輯任務(wù)]中,選擇[步驟3,設置];
?、蹖A(瀏覽器標識)設置為“手機”.
2. 如何手動(dòng)選擇列表數據(自動(dòng)識別失敗時(shí))
在采集列表頁(yè)面中,如果列表的自動(dòng)識別失敗,或者所識別的數據不是我們認為的數據,那么我們需要手動(dòng)選擇列表數據.
如何手動(dòng)選擇列表數據?
?、賳螕鬧全部清除]清除現有字段.
?、趩螕舨藛螜谥械腫列表數據],選擇[選擇列表]
?、凼褂檬髽藛螕袅斜碇械娜魏卧?
?、軉螕袅斜砹硪恍兄械南嗨圃?
在通常情況下,采集器將自動(dòng)枚舉列表中的所有字段. 我們可以對結果進(jìn)行一些更改.
如果未列出字段,則需要手動(dòng)添加字段. 單擊[添加字段],然后單擊列表中的元素數據.
3. 對于采集文章文字,如果鼠標無(wú)法選擇全部?jì)热菰撛趺崔k?
通常,在優(yōu)采云采集器中,用鼠標單擊以選擇要捕獲的內容. 但是,在某些情況下,例如當您想獲取文章的完整內容時(shí),當內容很長(cháng)時(shí),有時(shí)很難找到鼠標.
?、傥覀兛梢酝ㄟ^(guò)右鍵單擊網(wǎng)頁(yè)并選擇[檢查元素]來(lái)找到內容.
?、谕ㄟ^(guò)單擊[向上]按鈕來(lái)放大所選內容.
?、蹟U展到我們的全部?jì)热輹r(shí),選擇所有[XPath]并復制.
?、苄薷淖侄蔚腦Path,粘貼到剛剛復制的XPath中,然后確認.
?、葑詈?,修改值屬性. 如果需要HMTL,請使用InnerHTML或OuterHTML.
軟件特別說(shuō)明
360安全衛士用戶(hù)注意: 由于360軟件的錯誤警報,單個(gè)文件(包括uninst.exe)被刪除,導致程序無(wú)法正常運行,請在退出之前退出360軟件安裝














