亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久

采集內容管理平臺

采集內容管理平臺

采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 122 次瀏覽 ? 2022-02-24 22:13 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)
  DMP數據管理平臺(DMP)——在DMP的廣告營(yíng)銷(xiāo)生態(tài)鏈中,SameData處于數據管理平臺的DMP環(huán)節,用于為整個(gè)競價(jià)模式提供實(shí)時(shí)的購買(mǎi)受眾數據。在RTB領(lǐng)域,相比于需求側平臺DSP和供應側平臺SSP,DMP也發(fā)揮著(zhù)重要作用。因為沒(méi)有DMP,所以無(wú)法實(shí)時(shí)判斷目標受眾和單個(gè)受眾的價(jià)格,更談不上實(shí)時(shí)競價(jià)。SameData 利用了一個(gè)巨大的數據庫。通過(guò)川陽(yáng)的ABP受眾購買(mǎi)平臺(DSP平臺),可以在廣告執行前后,以非常直觀(guān)、直觀(guān)的形式,通過(guò)各個(gè)維度向廣告主和代理商展示廣告的全過(guò)程。
  具體來(lái)說(shuō),SameData 在廣告營(yíng)銷(xiāo)生態(tài)鏈中的工作原理和流程如下: 交換平臺或媒體的印象產(chǎn)生后,平臺或媒體通過(guò)標準協(xié)議向 DSP 平臺發(fā)送請求,通常攜帶的信息包括媒體名稱(chēng)。、媒體分類(lèi)、頁(yè)面URL、頁(yè)面上下文關(guān)鍵詞、媒體設定的最低價(jià)格,以及最重要的信息——用戶(hù)cookies。DSP通過(guò)查找預先建立的用戶(hù)映射庫,將用戶(hù)轉化為DSP平臺可以識別的用戶(hù),然后綜合計算從交易平臺或媒體接收到的所有信息,篩選出合適的廣告和最高出價(jià)為廣告,然后放廣告ID,素材地址、跳轉地址、大小、類(lèi)型等回傳給平臺和媒體。中標成功后,平臺會(huì )將中標信息發(fā)送給DSP平臺。實(shí)時(shí)競價(jià)中觀(guān)眾購買(mǎi)涉及的整個(gè)環(huán)境數據需要底層DMP提供。
  因此,由 SameData 驅動(dòng)的 DMP 將不再只關(guān)注實(shí)時(shí)競價(jià)廣告的點(diǎn)擊優(yōu)化,而更多地基于提供企業(yè)受眾細分,進(jìn)一步實(shí)現展示廣告的精準定位和網(wǎng)站優(yōu)化。搜索定位和多次重復定位、受眾研究和數據挖掘 DMP 細分受眾(消費者)并為這些細分受眾購買(mǎi)或出售廣告印象。數據管理平臺將提供更合理、科學(xué)的算法和分析依據,幫助客戶(hù)和媒體高管判斷什么樣的受眾是優(yōu)質(zhì)的,什么樣的廣告平臺有更多這樣的優(yōu)質(zhì)廣告受眾群體,從而得到結果營(yíng)銷(xiāo)推廣的效率更高,效果更好。 查看全部

  采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)
  DMP數據管理平臺(DMP)——在DMP的廣告營(yíng)銷(xiāo)生態(tài)鏈中,SameData處于數據管理平臺的DMP環(huán)節,用于為整個(gè)競價(jià)模式提供實(shí)時(shí)的購買(mǎi)受眾數據。在RTB領(lǐng)域,相比于需求側平臺DSP和供應側平臺SSP,DMP也發(fā)揮著(zhù)重要作用。因為沒(méi)有DMP,所以無(wú)法實(shí)時(shí)判斷目標受眾和單個(gè)受眾的價(jià)格,更談不上實(shí)時(shí)競價(jià)。SameData 利用了一個(gè)巨大的數據庫。通過(guò)川陽(yáng)的ABP受眾購買(mǎi)平臺(DSP平臺),可以在廣告執行前后,以非常直觀(guān)、直觀(guān)的形式,通過(guò)各個(gè)維度向廣告主和代理商展示廣告的全過(guò)程。
  具體來(lái)說(shuō),SameData 在廣告營(yíng)銷(xiāo)生態(tài)鏈中的工作原理和流程如下: 交換平臺或媒體的印象產(chǎn)生后,平臺或媒體通過(guò)標準協(xié)議向 DSP 平臺發(fā)送請求,通常攜帶的信息包括媒體名稱(chēng)。、媒體分類(lèi)、頁(yè)面URL、頁(yè)面上下文關(guān)鍵詞、媒體設定的最低價(jià)格,以及最重要的信息——用戶(hù)cookies。DSP通過(guò)查找預先建立的用戶(hù)映射庫,將用戶(hù)轉化為DSP平臺可以識別的用戶(hù),然后綜合計算從交易平臺或媒體接收到的所有信息,篩選出合適的廣告和最高出價(jià)為廣告,然后放廣告ID,素材地址、跳轉地址、大小、類(lèi)型等回傳給平臺和媒體。中標成功后,平臺會(huì )將中標信息發(fā)送給DSP平臺。實(shí)時(shí)競價(jià)中觀(guān)眾購買(mǎi)涉及的整個(gè)環(huán)境數據需要底層DMP提供。
  因此,由 SameData 驅動(dòng)的 DMP 將不再只關(guān)注實(shí)時(shí)競價(jià)廣告的點(diǎn)擊優(yōu)化,而更多地基于提供企業(yè)受眾細分,進(jìn)一步實(shí)現展示廣告的精準定位和網(wǎng)站優(yōu)化。搜索定位和多次重復定位、受眾研究和數據挖掘 DMP 細分受眾(消費者)并為這些細分受眾購買(mǎi)或出售廣告印象。數據管理平臺將提供更合理、科學(xué)的算法和分析依據,幫助客戶(hù)和媒體高管判斷什么樣的受眾是優(yōu)質(zhì)的,什么樣的廣告平臺有更多這樣的優(yōu)質(zhì)廣告受眾群體,從而得到結果營(yíng)銷(xiāo)推廣的效率更高,效果更好。

采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 147 次瀏覽 ? 2022-02-24 18:08 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)
  推薦理由:雨小說(shuō)cms是現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架管理軟件,可以很好地為用戶(hù)提供快速建站和網(wǎng)站@采集方法,用戶(hù)可以有效添加網(wǎng)站框架內容包括書(shū)架、評論、搜索、最近閱讀的內容等。新版本更新修復了wap模板和背景分類(lèi)的問(wèn)題,數據結構也類(lèi)似之后相應的優(yōu)化,可以很好的找回聯(lián)盟密碼。運行環(huán)境需要通用服務(wù)器,歡迎有需要的用戶(hù)下載使用。
  野雨小說(shuō)cms簡(jiǎn)介:
  狂語(yǔ)小說(shuō)內容管理系統(以下簡(jiǎn)稱(chēng)KYXScms)的最大特點(diǎn)是靈活、方便、人性化的設計和簡(jiǎn)單易用。有大量小說(shuō)網(wǎng)站的行業(yè),批量采集目標網(wǎng)站數據或使用數據聯(lián)盟自動(dòng)采集獲取大量數據。內置標簽模板,即使是不懂代碼的前端開(kāi)發(fā)者也能快速創(chuàng )作出精美小說(shuō)網(wǎng)站。
  安裝注意事項:
  KYXScms是基于ThinkPHP5.1+MYSQL開(kāi)發(fā)的,可以運行在最常見(jiàn)的服務(wù)器上。
  如windows服務(wù)器、IIS+PHP+MYSQL、
  Linux服務(wù)器,Apache/Nginx+PHP+MYSQL
  強烈建議使用 Linux 服務(wù)器以獲得更大的性能優(yōu)勢
  軟件方面,PHP需要5.6版本以上,5.6版本以下無(wú)法運行。
  硬件方面,一般配置虛擬主機就可以正常運行系統,如果有服務(wù)器就更好了。
  安裝步驟:
  1.解壓文件并上傳到對應目錄等
  2.網(wǎng)站必須配置偽靜態(tài)才能正常安裝使用(第一次訪(fǎng)問(wèn)首頁(yè)會(huì )自動(dòng)進(jìn)入安裝頁(yè)面,或者手動(dòng)輸入域名.com/install)
  3.同意使用協(xié)議進(jìn)入下一步檢查目錄權限
  4.測試通過(guò)后,填寫(xiě)常規數據庫配置項,填寫(xiě)正確,安裝成功。安裝成功后會(huì )自動(dòng)進(jìn)入后臺頁(yè)面域名.com/admin,填寫(xiě)安裝時(shí)輸入的后臺管理員和密碼登錄
  軟件特點(diǎn):
  1.網(wǎng)站采集可以采集任何小說(shuō)網(wǎng)站的功能
  2.數據聯(lián)盟,即使沒(méi)有設置采集的功能,也可以獲得大量新奇數據
  3、前端模板自適應(PC、手機、平板自動(dòng)適配)
  4、搜索關(guān)聯(lián)
  5、書(shū)架功能 查看全部

  采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)
  推薦理由:雨小說(shuō)cms是現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架管理軟件,可以很好地為用戶(hù)提供快速建站和網(wǎng)站@采集方法,用戶(hù)可以有效添加網(wǎng)站框架內容包括書(shū)架、評論、搜索、最近閱讀的內容等。新版本更新修復了wap模板和背景分類(lèi)的問(wèn)題,數據結構也類(lèi)似之后相應的優(yōu)化,可以很好的找回聯(lián)盟密碼。運行環(huán)境需要通用服務(wù)器,歡迎有需要的用戶(hù)下載使用。
  野雨小說(shuō)cms簡(jiǎn)介:
  狂語(yǔ)小說(shuō)內容管理系統(以下簡(jiǎn)稱(chēng)KYXScms)的最大特點(diǎn)是靈活、方便、人性化的設計和簡(jiǎn)單易用。有大量小說(shuō)網(wǎng)站的行業(yè),批量采集目標網(wǎng)站數據或使用數據聯(lián)盟自動(dòng)采集獲取大量數據。內置標簽模板,即使是不懂代碼的前端開(kāi)發(fā)者也能快速創(chuàng )作出精美小說(shuō)網(wǎng)站。
  安裝注意事項:
  KYXScms是基于ThinkPHP5.1+MYSQL開(kāi)發(fā)的,可以運行在最常見(jiàn)的服務(wù)器上。
  如windows服務(wù)器、IIS+PHP+MYSQL、
  Linux服務(wù)器,Apache/Nginx+PHP+MYSQL
  強烈建議使用 Linux 服務(wù)器以獲得更大的性能優(yōu)勢
  軟件方面,PHP需要5.6版本以上,5.6版本以下無(wú)法運行。
  硬件方面,一般配置虛擬主機就可以正常運行系統,如果有服務(wù)器就更好了。
  安裝步驟:
  1.解壓文件并上傳到對應目錄等
  2.網(wǎng)站必須配置偽靜態(tài)才能正常安裝使用(第一次訪(fǎng)問(wèn)首頁(yè)會(huì )自動(dòng)進(jìn)入安裝頁(yè)面,或者手動(dòng)輸入域名.com/install)
  3.同意使用協(xié)議進(jìn)入下一步檢查目錄權限
  4.測試通過(guò)后,填寫(xiě)常規數據庫配置項,填寫(xiě)正確,安裝成功。安裝成功后會(huì )自動(dòng)進(jìn)入后臺頁(yè)面域名.com/admin,填寫(xiě)安裝時(shí)輸入的后臺管理員和密碼登錄
  軟件特點(diǎn):
  1.網(wǎng)站采集可以采集任何小說(shuō)網(wǎng)站的功能
  2.數據聯(lián)盟,即使沒(méi)有設置采集的功能,也可以獲得大量新奇數據
  3、前端模板自適應(PC、手機、平板自動(dòng)適配)
  4、搜索關(guān)聯(lián)
  5、書(shū)架功能

采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 107 次瀏覽 ? 2022-02-20 14:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)
  采集內容管理平臺是做什么的,參考百度百科:內容管理平臺,簡(jiǎn)單的說(shuō),就是幫助企業(yè)進(jìn)行內容的管理的,一般可分為內容采集和內容管理,以及內容的分發(fā)和呈現,這些內容平臺通過(guò)前端的采集系統和審核系統對文章的數據進(jìn)行加工處理,形成采集結果數據,給予后端的存儲、分發(fā)和呈現方面的更為詳細的指導。下面會(huì )以免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集?。
  1、文本采集:對文本進(jìn)行采集的技術(shù)主要是html5sequenceextension。其主要特點(diǎn)是簡(jiǎn)單快捷易用,成本低廉,速度快,數據準確。
  2、圖片采集:通過(guò)圖片的分享來(lái)進(jìn)行文字的采集。比如在微信、qq等私人空間可以發(fā)送圖片鏈接(帶有廣告信息的還需要進(jìn)行審核),將圖片分享到微信、qq等平臺,微信等平臺打開(kāi)圖片鏈接獲取文字之后,按規則輸入內容,然后生成文本。
  3、視頻采集:通過(guò)自動(dòng)生成的flv視頻鏈接,對視頻中的文字進(jìn)行采集,現在視頻網(wǎng)站都有視頻標題搜索功能,這個(gè)技術(shù)也可以用于搜索引擎爬蟲(chóng)。
  4、音頻采集:音頻采集現在很多人都需要抓取音頻資源,無(wú)論是網(wǎng)絡(luò )音頻還是現實(shí)中的語(yǔ)音。
  5、視頻錄制:音頻的采集比較簡(jiǎn)單,采集主要是將音頻進(jìn)行采集,然后匹配數據庫,生成數據庫的文本信息。
  6、音頻格式轉換:音頻格式的轉換主要分為音頻格式轉換的編碼格式和傳輸協(xié)議等,現在主要是4.0gpt格式和utf-8編碼,數據格式包括.mp3,.flac,.m4v等。
  哪些內容可放采集結果?
  1、文字:有時(shí)候一篇文章中需要大量的文字鏈接,需要對每一段文字進(jìn)行采集,編碼方式自定義,utf-8即可。
  2、音頻:將音頻數據采集,編碼方式自定義,utf-8即可。
  3、圖片:通過(guò)采集文章的鏈接,利用http的url重定向(或直接rewrite)獲取。
  4、視頻:通過(guò)采集鏈接,傳輸到后端,傳輸協(xié)議自定義,utf-8即可。
  哪些內容可提取內容?
  1、文本提?。河胾rl對文本進(jìn)行抓取,對內容進(jìn)行匹配,提取出關(guān)鍵詞,點(diǎn)擊內容即可。
  2、圖片提?。篴、對圖片進(jìn)行采集,編碼方式自定義,utf-8即可。b、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。c、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。
  3、文件名提?。禾崛∥募械年P(guān)鍵詞。
  提取關(guān)鍵詞的方法有:
  1、從word中提??;
  2、從excel中提取。
  4、一句話(huà)提?。和ㄟ^(guò)提取文字和關(guān)鍵詞,匹配excel或者是文件名中的關(guān)鍵詞。
  提取文字方法有:
  5、關(guān)鍵詞密度提?。阂崛∧酬P(guān)鍵詞時(shí),分析該關(guān)鍵詞的關(guān)注人數,然后統計該關(guān)鍵詞的人數, 查看全部

  采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)
  采集內容管理平臺是做什么的,參考百度百科:內容管理平臺,簡(jiǎn)單的說(shuō),就是幫助企業(yè)進(jìn)行內容的管理的,一般可分為內容采集和內容管理,以及內容的分發(fā)和呈現,這些內容平臺通過(guò)前端的采集系統和審核系統對文章的數據進(jìn)行加工處理,形成采集結果數據,給予后端的存儲、分發(fā)和呈現方面的更為詳細的指導。下面會(huì )以免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集?。
  1、文本采集:對文本進(jìn)行采集的技術(shù)主要是html5sequenceextension。其主要特點(diǎn)是簡(jiǎn)單快捷易用,成本低廉,速度快,數據準確。
  2、圖片采集:通過(guò)圖片的分享來(lái)進(jìn)行文字的采集。比如在微信、qq等私人空間可以發(fā)送圖片鏈接(帶有廣告信息的還需要進(jìn)行審核),將圖片分享到微信、qq等平臺,微信等平臺打開(kāi)圖片鏈接獲取文字之后,按規則輸入內容,然后生成文本。
  3、視頻采集:通過(guò)自動(dòng)生成的flv視頻鏈接,對視頻中的文字進(jìn)行采集,現在視頻網(wǎng)站都有視頻標題搜索功能,這個(gè)技術(shù)也可以用于搜索引擎爬蟲(chóng)。
  4、音頻采集:音頻采集現在很多人都需要抓取音頻資源,無(wú)論是網(wǎng)絡(luò )音頻還是現實(shí)中的語(yǔ)音。
  5、視頻錄制:音頻的采集比較簡(jiǎn)單,采集主要是將音頻進(jìn)行采集,然后匹配數據庫,生成數據庫的文本信息。
  6、音頻格式轉換:音頻格式的轉換主要分為音頻格式轉換的編碼格式和傳輸協(xié)議等,現在主要是4.0gpt格式和utf-8編碼,數據格式包括.mp3,.flac,.m4v等。
  哪些內容可放采集結果?
  1、文字:有時(shí)候一篇文章中需要大量的文字鏈接,需要對每一段文字進(jìn)行采集,編碼方式自定義,utf-8即可。
  2、音頻:將音頻數據采集,編碼方式自定義,utf-8即可。
  3、圖片:通過(guò)采集文章的鏈接,利用http的url重定向(或直接rewrite)獲取。
  4、視頻:通過(guò)采集鏈接,傳輸到后端,傳輸協(xié)議自定義,utf-8即可。
  哪些內容可提取內容?
  1、文本提?。河胾rl對文本進(jìn)行抓取,對內容進(jìn)行匹配,提取出關(guān)鍵詞,點(diǎn)擊內容即可。
  2、圖片提?。篴、對圖片進(jìn)行采集,編碼方式自定義,utf-8即可。b、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。c、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。
  3、文件名提?。禾崛∥募械年P(guān)鍵詞。
  提取關(guān)鍵詞的方法有:
  1、從word中提??;
  2、從excel中提取。
  4、一句話(huà)提?。和ㄟ^(guò)提取文字和關(guān)鍵詞,匹配excel或者是文件名中的關(guān)鍵詞。
  提取文字方法有:
  5、關(guān)鍵詞密度提?。阂崛∧酬P(guān)鍵詞時(shí),分析該關(guān)鍵詞的關(guān)注人數,然后統計該關(guān)鍵詞的人數,

采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 133 次瀏覽 ? 2022-02-18 07:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)
  KesioncmsKesion內容管理系統是一個(gè)功能強大且應用廣泛的ASP管理系統。由科訊cms開(kāi)發(fā),具有強大、穩定、安全、靈活、易用等優(yōu)點(diǎn)。采用人性化的管理功能,擴展性強,負載能力好,模板調用靈活,可為用戶(hù)提供強大的管理服務(wù)功能。
  
  [基本介紹] Kesioncms作為國內最先進(jìn)的ASP管理系統,自誕生以來(lái)已經(jīng)通過(guò)了5年的運行考驗。它一直受到廣大用戶(hù)的青睞,以其自身的優(yōu)勢,穩定性、安全性、靈活性、易用性等諸多優(yōu)勢。在廣大用戶(hù)的大力支持下,Kesioncms V6版在cms的世界里有了更多的創(chuàng )新和突破。它不負眾望,追求卓越。這是一套專(zhuān)業(yè)開(kāi)放的網(wǎng)站管理系統,通過(guò)她讓建站更簡(jiǎn)單,你再也不用為建站發(fā)愁了,凱信cms人性化的操作模式,強大的后臺管理功能,非常便捷的管理模式,可根據您的需要進(jìn)行定制。定義風(fēng)格的萬(wàn)能標簽,讓非專(zhuān)業(yè)人士也能專(zhuān)業(yè),專(zhuān)業(yè)管理網(wǎng)站為您節省時(shí)間,提高工作效率;系統沒(méi)有任何文件加密,完全開(kāi)源的程序具有無(wú)限的擴展性和可擴展性,靈活的系統二次開(kāi)發(fā)結構可以快速集成第三方軟件,系統徹底解決企業(yè)用戶(hù)的后顧之憂(yōu)-友好的管理界面、操作方式和豐富的功能特點(diǎn)。
  我們相信“簡(jiǎn)單就是美”,因此,科訊的開(kāi)發(fā)者在開(kāi)發(fā)過(guò)程中始終充分考慮用戶(hù)的使用習慣,盡量降低用戶(hù)的使用門(mén)檻,讓用戶(hù)可以專(zhuān)注于內容維護本身,無(wú)需投入過(guò)多時(shí)間學(xué)習如何使用系統,注意細節。
  作為中國最大的網(wǎng)站管理系統軟件和服務(wù)提供商,我們的開(kāi)發(fā)團隊擁有豐富的Web應用設計經(jīng)驗,尤其是在管理系統產(chǎn)品及相關(guān)領(lǐng)域。經(jīng)過(guò)長(cháng)期的創(chuàng )新發(fā)展,我們掌握了一整套從算法、數據結構到產(chǎn)品安全的領(lǐng)先技術(shù)。這使得凱勝cms在易用性、穩定性、承載能力、安全保障等方面處于國內外同類(lèi)產(chǎn)品的領(lǐng)先地位。
  [軟件特點(diǎn)] ☆。系統采用模塊化開(kāi)發(fā),100%開(kāi)源,擴展性更強,二次開(kāi)發(fā)更方便。
  系統模型管理,可以暫時(shí)屏蔽不需要的功能模型,需要時(shí)再打開(kāi)。
  ☆、支持無(wú)限列,可綁定二級域名,加載速度更快
  可以分批添加色譜柱以提高效率并節省時(shí)間??梢酝ㄟ^(guò)一鍵對列進(jìn)行排序來(lái)改變列的生成順序
  ☆。系統支持3種生成方式,全站生成HTML靜態(tài)和動(dòng)態(tài)ASP和偽靜態(tài)
<p>整個(gè)系統可以生成靜態(tài)HTML,有效的提高了系統的性能,不僅減輕了服務(wù)器的負載,提高了收錄的搜索率,還提高了網(wǎng)站 查看全部

  采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)
  KesioncmsKesion內容管理系統是一個(gè)功能強大且應用廣泛的ASP管理系統。由科訊cms開(kāi)發(fā),具有強大、穩定、安全、靈活、易用等優(yōu)點(diǎn)。采用人性化的管理功能,擴展性強,負載能力好,模板調用靈活,可為用戶(hù)提供強大的管理服務(wù)功能。
  
  [基本介紹] Kesioncms作為國內最先進(jìn)的ASP管理系統,自誕生以來(lái)已經(jīng)通過(guò)了5年的運行考驗。它一直受到廣大用戶(hù)的青睞,以其自身的優(yōu)勢,穩定性、安全性、靈活性、易用性等諸多優(yōu)勢。在廣大用戶(hù)的大力支持下,Kesioncms V6版在cms的世界里有了更多的創(chuàng )新和突破。它不負眾望,追求卓越。這是一套專(zhuān)業(yè)開(kāi)放的網(wǎng)站管理系統,通過(guò)她讓建站更簡(jiǎn)單,你再也不用為建站發(fā)愁了,凱信cms人性化的操作模式,強大的后臺管理功能,非常便捷的管理模式,可根據您的需要進(jìn)行定制。定義風(fēng)格的萬(wàn)能標簽,讓非專(zhuān)業(yè)人士也能專(zhuān)業(yè),專(zhuān)業(yè)管理網(wǎng)站為您節省時(shí)間,提高工作效率;系統沒(méi)有任何文件加密,完全開(kāi)源的程序具有無(wú)限的擴展性和可擴展性,靈活的系統二次開(kāi)發(fā)結構可以快速集成第三方軟件,系統徹底解決企業(yè)用戶(hù)的后顧之憂(yōu)-友好的管理界面、操作方式和豐富的功能特點(diǎn)。
  我們相信“簡(jiǎn)單就是美”,因此,科訊的開(kāi)發(fā)者在開(kāi)發(fā)過(guò)程中始終充分考慮用戶(hù)的使用習慣,盡量降低用戶(hù)的使用門(mén)檻,讓用戶(hù)可以專(zhuān)注于內容維護本身,無(wú)需投入過(guò)多時(shí)間學(xué)習如何使用系統,注意細節。
  作為中國最大的網(wǎng)站管理系統軟件和服務(wù)提供商,我們的開(kāi)發(fā)團隊擁有豐富的Web應用設計經(jīng)驗,尤其是在管理系統產(chǎn)品及相關(guān)領(lǐng)域。經(jīng)過(guò)長(cháng)期的創(chuàng )新發(fā)展,我們掌握了一整套從算法、數據結構到產(chǎn)品安全的領(lǐng)先技術(shù)。這使得凱勝cms在易用性、穩定性、承載能力、安全保障等方面處于國內外同類(lèi)產(chǎn)品的領(lǐng)先地位。
  [軟件特點(diǎn)] ☆。系統采用模塊化開(kāi)發(fā),100%開(kāi)源,擴展性更強,二次開(kāi)發(fā)更方便。
  系統模型管理,可以暫時(shí)屏蔽不需要的功能模型,需要時(shí)再打開(kāi)。
  ☆、支持無(wú)限列,可綁定二級域名,加載速度更快
  可以分批添加色譜柱以提高效率并節省時(shí)間??梢酝ㄟ^(guò)一鍵對列進(jìn)行排序來(lái)改變列的生成順序
  ☆。系統支持3種生成方式,全站生成HTML靜態(tài)和動(dòng)態(tài)ASP和偽靜態(tài)
<p>整個(gè)系統可以生成靜態(tài)HTML,有效的提高了系統的性能,不僅減輕了服務(wù)器的負載,提高了收錄的搜索率,還提高了網(wǎng)站

采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 112 次瀏覽 ? 2022-02-16 15:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)
  采集內容管理平臺
  你一直問(wèn)中介方利益相關(guān)的問(wèn)題嗎?我覺(jué)得你們不談價(jià)格,談?wù)劮?wù)模式是比較合理的。另外,我覺(jué)得中介應該有責任告訴客戶(hù),資金凍結的依據、怎么解凍、解凍后再往外推錢(qián)該怎么辦?如果發(fā)生糾紛,怎么解決,
  目前正在從事國內房產(chǎn)中介服務(wù)行業(yè),我簡(jiǎn)單的闡述我的認識和理解。作為一個(gè)經(jīng)紀人你就需要明確,你將要賣(mài)房的房產(chǎn)優(yōu)缺點(diǎn)以及價(jià)格要求,并且需要用合適的方式去解決。作為一個(gè)資深的房產(chǎn)經(jīng)紀人,還應該有一個(gè)基本價(jià)值觀(guān),就是說(shuō)不是你想給中介多少錢(qián),中介就需要給你多少錢(qián),或者,你直接找中介的房源,中介會(huì )給你安排多少錢(qián)的房源。他要考慮合理的推薦的房源以及適當的對接房東,畢竟賣(mài)房的才是大爺。
  資金池問(wèn)題
  目前進(jìn)入市場(chǎng)的中介全是信息混亂的,如果你的房子有價(jià)格和信息優(yōu)勢,可以相互結對子找別的中介做朋友,資金池應該是規避不了的,不過(guò)你說(shuō)的找個(gè)安全可靠的,太多人做了,最終估計就是數量就過(guò)濾了,換一家就是了,對你來(lái)說(shuō),找到一個(gè)有合適資金安全的平臺,
  房產(chǎn)中介應該有合理的成本結構,依我來(lái)看,任何推薦、融資都會(huì )有一定的風(fēng)險,就像新加坡globallendingpartners披露的手續費是個(gè)極為大的坑,大部分中介會(huì )主動(dòng)選擇把費用降低到每次交易0.5%-1%,個(gè)別甚至不到每月5%.如果某中介真誠推薦,最多能給你這么少費用,但是如果這中介收高于其他顧問(wèn)的費用,我個(gè)人認為他是能力問(wèn)題或者以后怎么做做好本職工作的問(wèn)題。 查看全部

  采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)
  采集內容管理平臺
  你一直問(wèn)中介方利益相關(guān)的問(wèn)題嗎?我覺(jué)得你們不談價(jià)格,談?wù)劮?wù)模式是比較合理的。另外,我覺(jué)得中介應該有責任告訴客戶(hù),資金凍結的依據、怎么解凍、解凍后再往外推錢(qián)該怎么辦?如果發(fā)生糾紛,怎么解決,
  目前正在從事國內房產(chǎn)中介服務(wù)行業(yè),我簡(jiǎn)單的闡述我的認識和理解。作為一個(gè)經(jīng)紀人你就需要明確,你將要賣(mài)房的房產(chǎn)優(yōu)缺點(diǎn)以及價(jià)格要求,并且需要用合適的方式去解決。作為一個(gè)資深的房產(chǎn)經(jīng)紀人,還應該有一個(gè)基本價(jià)值觀(guān),就是說(shuō)不是你想給中介多少錢(qián),中介就需要給你多少錢(qián),或者,你直接找中介的房源,中介會(huì )給你安排多少錢(qián)的房源。他要考慮合理的推薦的房源以及適當的對接房東,畢竟賣(mài)房的才是大爺。
  資金池問(wèn)題
  目前進(jìn)入市場(chǎng)的中介全是信息混亂的,如果你的房子有價(jià)格和信息優(yōu)勢,可以相互結對子找別的中介做朋友,資金池應該是規避不了的,不過(guò)你說(shuō)的找個(gè)安全可靠的,太多人做了,最終估計就是數量就過(guò)濾了,換一家就是了,對你來(lái)說(shuō),找到一個(gè)有合適資金安全的平臺,
  房產(chǎn)中介應該有合理的成本結構,依我來(lái)看,任何推薦、融資都會(huì )有一定的風(fēng)險,就像新加坡globallendingpartners披露的手續費是個(gè)極為大的坑,大部分中介會(huì )主動(dòng)選擇把費用降低到每次交易0.5%-1%,個(gè)別甚至不到每月5%.如果某中介真誠推薦,最多能給你這么少費用,但是如果這中介收高于其他顧問(wèn)的費用,我個(gè)人認為他是能力問(wèn)題或者以后怎么做做好本職工作的問(wèn)題。

采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 155 次瀏覽 ? 2022-02-16 05:04 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)
  信息模板.doc(133.5 K)
  我們公司需要做一個(gè)“數據采集管理系統”。就是從一些公開(kāi)的網(wǎng)站信息中采集、整理數據,然后按照規定的格式將文本輸入到系統中,以便系統進(jìn)行事后統計、分析、整理和分類(lèi)。
  一、系統的組成結構為:WEB瀏覽器客戶(hù)端,由表示層、業(yè)務(wù)層、數據層等組成的中間層,以及數據庫服務(wù)器。
  二、系統的功能有:
  1、系統管理
  包括系統運行前必須設置的基本信息和系統用戶(hù)賬號的統一管理?;A信息是整個(gè)系統的基本元數據,是系統完整運行的前提。用戶(hù)賬號與人員信息相關(guān)聯(lián),人員信息是所有使用系統的人員的身份識別信息,用戶(hù)對系統的訪(fǎng)問(wèn)由賬號管理控制。
  具體內容包括:組織管理、員工管理、權限管理、操作賬號管理、操作日志管理
  2、數據采集管理
  管理數據分類(lèi)設置,組織輸入數據并提供基本查詢(xún)功能。
  3、數據查詢(xún)管理
  根據數據的各個(gè)關(guān)鍵字段,查詢(xún)復雜的組合條件。
  4、數據統計管理
  按條件統計采集數據的相關(guān)指標。
  三、要求:
  1、系統基于INTERNET標準協(xié)議,可在廣域網(wǎng)條件下工作。
  2、系統采用企業(yè)級應用服務(wù)器平臺,可實(shí)現多服務(wù)器負載均衡、多數據庫連接等擴展,保證數據處理能力的擴展。
  3、系統采用完整的BS結構,維護工作全部在服務(wù)器端進(jìn)行,沒(méi)有客戶(hù)端調試、維護等工作。大大減輕系統管理員的工作量。
  4、系統各項操作功能風(fēng)格一致,形象直觀(guān),簡(jiǎn)單易懂,一般用戶(hù)使用方便。
  5、當數據被輸入、修改或刪除時(shí),系統會(huì )自動(dòng)檢查和處理相關(guān)數據,并提示用戶(hù)提供相關(guān)信息,以保證數據的完整性和一致性。
  6、系統架構應該能夠保證數據庫的安全,避免信息被不當刪除。
  具體信息模板見(jiàn)附件。
  親愛(ài)的同學(xué)們,如果您有興趣并且能夠完成這項工作,您可以給我報價(jià)(在網(wǎng)站上短我)。有經(jīng)驗者優(yōu)先。謝謝! 查看全部

  采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)
  信息模板.doc(133.5 K)
  我們公司需要做一個(gè)“數據采集管理系統”。就是從一些公開(kāi)的網(wǎng)站信息中采集、整理數據,然后按照規定的格式將文本輸入到系統中,以便系統進(jìn)行事后統計、分析、整理和分類(lèi)。
  一、系統的組成結構為:WEB瀏覽器客戶(hù)端,由表示層、業(yè)務(wù)層、數據層等組成的中間層,以及數據庫服務(wù)器。
  二、系統的功能有:
  1、系統管理
  包括系統運行前必須設置的基本信息和系統用戶(hù)賬號的統一管理?;A信息是整個(gè)系統的基本元數據,是系統完整運行的前提。用戶(hù)賬號與人員信息相關(guān)聯(lián),人員信息是所有使用系統的人員的身份識別信息,用戶(hù)對系統的訪(fǎng)問(wèn)由賬號管理控制。
  具體內容包括:組織管理、員工管理、權限管理、操作賬號管理、操作日志管理
  2、數據采集管理
  管理數據分類(lèi)設置,組織輸入數據并提供基本查詢(xún)功能。
  3、數據查詢(xún)管理
  根據數據的各個(gè)關(guān)鍵字段,查詢(xún)復雜的組合條件。
  4、數據統計管理
  按條件統計采集數據的相關(guān)指標。
  三、要求:
  1、系統基于INTERNET標準協(xié)議,可在廣域網(wǎng)條件下工作。
  2、系統采用企業(yè)級應用服務(wù)器平臺,可實(shí)現多服務(wù)器負載均衡、多數據庫連接等擴展,保證數據處理能力的擴展。
  3、系統采用完整的BS結構,維護工作全部在服務(wù)器端進(jìn)行,沒(méi)有客戶(hù)端調試、維護等工作。大大減輕系統管理員的工作量。
  4、系統各項操作功能風(fēng)格一致,形象直觀(guān),簡(jiǎn)單易懂,一般用戶(hù)使用方便。
  5、當數據被輸入、修改或刪除時(shí),系統會(huì )自動(dòng)檢查和處理相關(guān)數據,并提示用戶(hù)提供相關(guān)信息,以保證數據的完整性和一致性。
  6、系統架構應該能夠保證數據庫的安全,避免信息被不當刪除。
  具體信息模板見(jiàn)附件。
  親愛(ài)的同學(xué)們,如果您有興趣并且能夠完成這項工作,您可以給我報價(jià)(在網(wǎng)站上短我)。有經(jīng)驗者優(yōu)先。謝謝!

采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 117 次瀏覽 ? 2022-02-15 19:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)
  采集內容管理平臺包括兩部分:采集數據服務(wù)商(如百度,esp等)與采集人員。我知道怎么操作,但以我已有的專(zhuān)業(yè)知識,我猜測您說(shuō)的這種采集平臺,應該只能采集公開(kāi)免費的資源,因為采集這些外鏈,或內容管理平臺就是做社交化推廣(也是做網(wǎng)站推廣),如果采集的是正式或灰色內容,
  你可以學(xué)學(xué)麥客在線(xiàn),采集進(jìn)來(lái)的內容操作都是用麥客在線(xiàn)的,
  麥客是常用工具中的一種,采集的時(shí)候需要針對內容有所選擇,僅需要采集發(fā)表過(guò)的內容即可。
  采集引擎可能知道采集哪個(gè)頁(yè)面,
  百度、搜狗、360、谷歌就算了??纯幢镜氐膁sp內容管理平臺吧。不過(guò)最近回答這類(lèi)問(wèn)題比較多,更推薦自己用的內容管理平臺-中搜內容管理平臺不僅可以采集也可以實(shí)現文章自動(dòng)分類(lèi)整理、文章的更新計劃,實(shí)現電子郵件的自動(dòng)發(fā)送,用戶(hù)群的自動(dòng)定位,過(guò)程管理等多重功能。
  百度蜘蛛挖了半天就得到一個(gè)頁(yè)面,
  現在的采集平臺的數據抓取部分有備份的,你得想辦法切掉源代碼。
  采集時(shí)可能會(huì )留下某些鏈接,不存在絕對的安全可靠,這個(gè)還是看采集平臺的策略。我目前知道的有麥客、鳥(niǎo)采。
  原來(lái)市面上有三個(gè)內容采集工具,采集效率,技術(shù)成熟度都不是很好,很容易爬很多頁(yè)面,這也是三個(gè)內容抓取工具的用戶(hù)群的原因。鳥(niǎo)采自動(dòng)采集,免費版就能采到99%的網(wǎng)站,價(jià)格也不貴,但平均下來(lái)每天要50元錢(qián),好像不能登錄/發(fā)送郵件。eoson全自動(dòng)采集,可以采到99%以上的網(wǎng)站,貴一點(diǎn)但能上網(wǎng)站首頁(yè),便宜又操作簡(jiǎn)單。
  百度云內容采集,可以說(shuō)是良心中的良心,免費,無(wú)廣告,一鍵登錄/發(fā)送郵件就好。很多網(wǎng)站的內容都能很方便的采集到。 查看全部

  采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)
  采集內容管理平臺包括兩部分:采集數據服務(wù)商(如百度,esp等)與采集人員。我知道怎么操作,但以我已有的專(zhuān)業(yè)知識,我猜測您說(shuō)的這種采集平臺,應該只能采集公開(kāi)免費的資源,因為采集這些外鏈,或內容管理平臺就是做社交化推廣(也是做網(wǎng)站推廣),如果采集的是正式或灰色內容,
  你可以學(xué)學(xué)麥客在線(xiàn),采集進(jìn)來(lái)的內容操作都是用麥客在線(xiàn)的,
  麥客是常用工具中的一種,采集的時(shí)候需要針對內容有所選擇,僅需要采集發(fā)表過(guò)的內容即可。
  采集引擎可能知道采集哪個(gè)頁(yè)面,
  百度、搜狗、360、谷歌就算了??纯幢镜氐膁sp內容管理平臺吧。不過(guò)最近回答這類(lèi)問(wèn)題比較多,更推薦自己用的內容管理平臺-中搜內容管理平臺不僅可以采集也可以實(shí)現文章自動(dòng)分類(lèi)整理、文章的更新計劃,實(shí)現電子郵件的自動(dòng)發(fā)送,用戶(hù)群的自動(dòng)定位,過(guò)程管理等多重功能。
  百度蜘蛛挖了半天就得到一個(gè)頁(yè)面,
  現在的采集平臺的數據抓取部分有備份的,你得想辦法切掉源代碼。
  采集時(shí)可能會(huì )留下某些鏈接,不存在絕對的安全可靠,這個(gè)還是看采集平臺的策略。我目前知道的有麥客、鳥(niǎo)采。
  原來(lái)市面上有三個(gè)內容采集工具,采集效率,技術(shù)成熟度都不是很好,很容易爬很多頁(yè)面,這也是三個(gè)內容抓取工具的用戶(hù)群的原因。鳥(niǎo)采自動(dòng)采集,免費版就能采到99%的網(wǎng)站,價(jià)格也不貴,但平均下來(lái)每天要50元錢(qián),好像不能登錄/發(fā)送郵件。eoson全自動(dòng)采集,可以采到99%以上的網(wǎng)站,貴一點(diǎn)但能上網(wǎng)站首頁(yè),便宜又操作簡(jiǎn)單。
  百度云內容采集,可以說(shuō)是良心中的良心,免費,無(wú)廣告,一鍵登錄/發(fā)送郵件就好。很多網(wǎng)站的內容都能很方便的采集到。

采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 150 次瀏覽 ? 2022-02-13 02:16 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)
  高職人才培養工作狀態(tài)資料采集及管理平臺V2.16a001操作指南一、總體流程2二、初始設置21.管理員登錄。22.系統設置 33.導入初始數據。3(1)選擇導入方式。4(2)讀入文件。5(3)導入數據。5(4)查看數據。6(5)生成數據中心.64、權限設置.7三、用戶(hù)登錄8四、網(wǎng)絡(luò )布局9五、系統設置(由狀態(tài)數據負責人操作)101.@ &gt;權限設置.102.工作分配.10(1)設置審核人/采集人員.11(2)添加負責人11(3)設置權限. 12 (4)批量設置采集 人員/審閱者。13(5)發(fā)布工作通知。143.工作統計。154.狀態(tài)設置.155.重置密碼.166.查看操作日志.16&lt; @7、數據源匹配檢測178、指標與數據項關(guān)聯(lián)檢測179.數據上報1810、工作統計2011、數據備份2211.1、備份平臺數據庫2211.2、導出標準版本22六、日常管理231、添加數據242、編輯數據263、審核數據27 4.單表導入28一、總體流程二、初始化設置管理員登錄-系統設置-導入初始化數據-權限設置-設置狀態(tài)數據管理員登錄負責人。打開(kāi)登錄頁(yè)面登錄,輸入9999,初始密碼為1。右上角有修改密碼按鈕,可以先修改密碼!登錄系統設置后。
  單擊主頁(yè)上的系統設置。導入初始數據。有四種導入初始數據。首先是導入2015標準版。主要針對首次使用網(wǎng)絡(luò )版的高校,從診改網(wǎng)站下載15年標準版數據并導入。本次導入只能導入15年的靜態(tài)數據,其他每年都變的數據不會(huì )導入。二是導入2016標準版。主要針對已經(jīng)在使用標準版采集的學(xué)校,這種導入方式可以導入2016標準版中的所有數據。三是提取數據。主要針對已經(jīng)在使用CRP系統的高校,無(wú)需人工采集提取各個(gè)系統的數據。第四,復制數據。主要針對去年用過(guò)網(wǎng)絡(luò )版的機構,去年的數據庫還在同一臺服務(wù)器上。抄數據其實(shí)就是抄2015年網(wǎng)絡(luò )版的數據和2015年的工作分布,只是表有很大的變化,比如四類(lèi)教師的教學(xué)情況。(只能復制審核通過(guò)的數據)如果2015網(wǎng)絡(luò )版數據庫中沒(méi)有服務(wù)器,請根據學(xué)校情況選擇第一個(gè)或第二個(gè)選項導入數據。由于導入方式相同,這里以導入2015標準版為例。選擇導入方法。點(diǎn)擊導入2015標準版,因為是第一次導入,所以只有清除數據的選項。單擊完成進(jìn)入下一步。讀入文件。選擇要導入的文件,然后單擊上傳進(jìn)入下一步。導入數據。單擊導入數據按鈕以導入數據。
  檢查數據。單擊檢查數據以檢查數據格式。如果數據有錯誤,請點(diǎn)擊下載錯誤信息,然后根據錯誤信息打開(kāi)標準版,找到錯誤的單元格,進(jìn)行修改。修改后需要重新讀取文件才能導入數據。生成數據中心。點(diǎn)擊 Generate Data 中的按鈕,完成數據導入。4、權限設置。權限設置主要針對學(xué)校領(lǐng)導和一些需要特殊權限的老師。其他 采集 或被審核教師的權限在作業(yè)中設置。管理員設置狀態(tài)數據所有者。點(diǎn)擊添加按鈕,依次勾選權限,點(diǎn)擊保存完成添加(以后權限設置,采集設置的操作 在登錄頁(yè)面輸入正確的卡號和密碼后,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集管理平臺(網(wǎng)絡(luò )版)。四、網(wǎng)絡(luò )版布局當用戶(hù)進(jìn)入狀態(tài)時(shí)data采集平臺(在線(xiàn)版)“狀態(tài)數據目錄”界面。網(wǎng)絡(luò )版平臺的版面設計參考“標準版”的版面方式,分為菜單區和工作內容區,以減少用戶(hù)的不適感。
  工作分配是對整個(gè)數據采集工作的合理安排。分為兩個(gè)階段:數據源表采集及其數據表采集,必須先完成源表的數據采集才能進(jìn)入下一階段。(比如7.1.1個(gè)專(zhuān)業(yè)表不采集好,那么后面會(huì )涉及到專(zhuān)業(yè)表,可能會(huì )出現無(wú)法選擇專(zhuān)業(yè)的情況。)設置審稿人/采集人。點(diǎn)擊管理頁(yè)面工作表記錄行“數據表負責人”欄的“設置”按鈕,打開(kāi)分配新工作負責人管理窗口(2)添加負責人點(diǎn)擊“添加人員負責” 按鈕打開(kāi)分配新負責人的管理窗口??梢詮摹安块T(mén)”下拉框中選擇部門(mén)查找要分配的用戶(hù),也可以直接在“部門(mén)”下拉框中輸入要分配的用戶(hù)的姓名/卡號在“姓名/卡號”輸入框找到它,然后勾選用戶(hù)記錄,點(diǎn)擊“添加”按鈕選擇用戶(hù),然后點(diǎn)擊“保存”按鈕完成分配。如果單擊“刪除負責人”按鈕,當前負責人權限將被刪除。同理,采集表數據負責人的分配方法參考上述說(shuō)明,只需點(diǎn)擊“數據表采集人”欄的“設置”按鈕進(jìn)行設置即可。
  操作步驟與設置reviewer 相同。(4)批量設置采集人員/審批人。點(diǎn)擊批量設置按鈕,依次選擇人員和負責人資料表,點(diǎn)擊保存完成設置。批量刪除功能,操作步驟為類(lèi)似。(5)發(fā)布工作通知。所有工作表都分配好工作計劃后,輸入“工作要求”和“完成時(shí)間”,點(diǎn)擊“發(fā)布工作通知”按鈕,完成發(fā)布工作工作通知。發(fā)布后,采集人登錄系統時(shí)會(huì )自動(dòng)彈出工作任務(wù)提示。注意:“采集其他數據表工作”和“&lt; @采集 數據源表的工作”類(lèi)似。&lt; @3.工作統計。發(fā)布 工作后,您可以在此處查看采集工作的進(jìn)度。4.狀態(tài)設置。該功能可以設置用戶(hù)是否允許采集或更改數據。(1)管理員點(diǎn)擊首頁(yè)“菜單區”的“系統設置”欄,點(diǎn)擊左側菜單“一、系統設置”下的“狀態(tài)設置”選項,打開(kāi)狀態(tài)設置管理頁(yè)面。
  稍后在補充說(shuō)明中說(shuō)明原因,點(diǎn)擊“保存...說(shuō)明”按鈕完成。9.數據上報 數據上報提供給用戶(hù)采集平臺中的狀態(tài)數據上報到教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。
  注意:頁(yè)面打開(kāi)可能需要一段時(shí)間(因為此時(shí)將生成案例研究的摘要數據),請稍候。(2)填寫(xiě)機構代碼、密碼(登錄云中心的密碼)和驗證碼,點(diǎn)擊“登錄”按鈕開(kāi)始進(jìn)入上報數據管理頁(yè)面。(3) “數據生成”將系統生成采集的狀態(tài)數據作為報告數據。選擇“年份”和“學(xué)校名稱(chēng)”后,點(diǎn)擊“生成”按鈕生成數據。(4)@ &gt; “數據上報”是將生成的數據上報到云端的“高職數據中心”,用戶(hù)可以點(diǎn)擊“上報”按鈕完成上報。注意:(1)上報時(shí),系統不應還有 ” 系統會(huì )自動(dòng)將任務(wù)變?yōu)椤斑M(jìn)行中”狀態(tài);當用戶(hù)完成data采集任務(wù)后,需要進(jìn)入該頁(yè)面點(diǎn)擊“操作”欄中的“完成”按鈕完成任務(wù),任務(wù)變?yōu)椤巴瓿伞睜顟B(tài);如果用戶(hù)任務(wù)到期前未完成任務(wù),系統會(huì )自動(dòng)變?yōu)椤拔赐瓿伞睜顟B(tài)。
  右上角按鈕,備份平臺數據庫。11.2、導出標準版說(shuō)明:如果需要將數據導出到標準版,必須先上報數據,然后登錄“中國職業(yè)教育評估”網(wǎng)站,操作在《高職院校人才培養工作狀況數據采集及管理平臺》中。日常管理包括:(1)按“工作分配”劃分,采集我負責的狀態(tài)數據;(2)默認用戶(hù)采集由系統自動(dòng)分配的狀態(tài)數據)系統(如專(zhuān)職教師,默認可以是2)默認用戶(hù)采集@采集6.表1狀態(tài)數據)。(3)數據管理員審核提交的狀態(tài)數據。注意:當用戶(hù)填寫(xiě)不在權限范圍內的狀態(tài)數據時(shí),系統會(huì )自動(dòng)提示告知。第一步:登錄系統。使用瀏覽器訪(fǎng)問(wèn)平臺網(wǎng)站。然后輸入卡號和密碼,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集和管理平臺。第 2 步:管理數據。
  勾選要編輯的記錄后,點(diǎn)擊“編輯”按鈕,打開(kāi)修改管理頁(yè)面。(2)更正相應內容后,點(diǎn)擊“保存”按鈕完成。注意:(1)如果用戶(hù)需要刪除一條記錄,可以先查看該記錄,然后點(diǎn)擊“刪除”按鈕刪除已經(jīng)過(guò)采集的狀態(tài)數據。(2)已經(jīng)審核“通過(guò)”的記錄不允許刪除。3、審核數據(1)勾選需要審核的記錄后,點(diǎn)擊“審核”按鈕,打開(kāi)審核記錄管理窗口。(2)選擇“審核結果”并填寫(xiě)“審核備注”,然后點(diǎn)擊“保存”按鈕完成。4.單一表單導入。(&lt; @1)點(diǎn)擊導入按鈕,進(jìn)入單表導入頁(yè)面。(2)點(diǎn)擊右上角下載導入的模板,將數據填入模板,導入即可。注意:?jiǎn)伪韺肟蛇x擇清空數據導入或添加數據。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清空模式導入只會(huì )清空該表。如果是擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。 查看全部

  采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)
  高職人才培養工作狀態(tài)資料采集及管理平臺V2.16a001操作指南一、總體流程2二、初始設置21.管理員登錄。22.系統設置 33.導入初始數據。3(1)選擇導入方式。4(2)讀入文件。5(3)導入數據。5(4)查看數據。6(5)生成數據中心.64、權限設置.7三、用戶(hù)登錄8四、網(wǎng)絡(luò )布局9五、系統設置(由狀態(tài)數據負責人操作)101.@ &gt;權限設置.102.工作分配.10(1)設置審核人/采集人員.11(2)添加負責人11(3)設置權限. 12 (4)批量設置采集 人員/審閱者。13(5)發(fā)布工作通知。143.工作統計。154.狀態(tài)設置.155.重置密碼.166.查看操作日志.16&lt; @7、數據源匹配檢測178、指標與數據項關(guān)聯(lián)檢測179.數據上報1810、工作統計2011、數據備份2211.1、備份平臺數據庫2211.2、導出標準版本22六、日常管理231、添加數據242、編輯數據263、審核數據27 4.單表導入28一、總體流程二、初始化設置管理員登錄-系統設置-導入初始化數據-權限設置-設置狀態(tài)數據管理員登錄負責人。打開(kāi)登錄頁(yè)面登錄,輸入9999,初始密碼為1。右上角有修改密碼按鈕,可以先修改密碼!登錄系統設置后。
  單擊主頁(yè)上的系統設置。導入初始數據。有四種導入初始數據。首先是導入2015標準版。主要針對首次使用網(wǎng)絡(luò )版的高校,從診改網(wǎng)站下載15年標準版數據并導入。本次導入只能導入15年的靜態(tài)數據,其他每年都變的數據不會(huì )導入。二是導入2016標準版。主要針對已經(jīng)在使用標準版采集的學(xué)校,這種導入方式可以導入2016標準版中的所有數據。三是提取數據。主要針對已經(jīng)在使用CRP系統的高校,無(wú)需人工采集提取各個(gè)系統的數據。第四,復制數據。主要針對去年用過(guò)網(wǎng)絡(luò )版的機構,去年的數據庫還在同一臺服務(wù)器上。抄數據其實(shí)就是抄2015年網(wǎng)絡(luò )版的數據和2015年的工作分布,只是表有很大的變化,比如四類(lèi)教師的教學(xué)情況。(只能復制審核通過(guò)的數據)如果2015網(wǎng)絡(luò )版數據庫中沒(méi)有服務(wù)器,請根據學(xué)校情況選擇第一個(gè)或第二個(gè)選項導入數據。由于導入方式相同,這里以導入2015標準版為例。選擇導入方法。點(diǎn)擊導入2015標準版,因為是第一次導入,所以只有清除數據的選項。單擊完成進(jìn)入下一步。讀入文件。選擇要導入的文件,然后單擊上傳進(jìn)入下一步。導入數據。單擊導入數據按鈕以導入數據。
  檢查數據。單擊檢查數據以檢查數據格式。如果數據有錯誤,請點(diǎn)擊下載錯誤信息,然后根據錯誤信息打開(kāi)標準版,找到錯誤的單元格,進(jìn)行修改。修改后需要重新讀取文件才能導入數據。生成數據中心。點(diǎn)擊 Generate Data 中的按鈕,完成數據導入。4、權限設置。權限設置主要針對學(xué)校領(lǐng)導和一些需要特殊權限的老師。其他 采集 或被審核教師的權限在作業(yè)中設置。管理員設置狀態(tài)數據所有者。點(diǎn)擊添加按鈕,依次勾選權限,點(diǎn)擊保存完成添加(以后權限設置,采集設置的操作 在登錄頁(yè)面輸入正確的卡號和密碼后,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集管理平臺(網(wǎng)絡(luò )版)。四、網(wǎng)絡(luò )版布局當用戶(hù)進(jìn)入狀態(tài)時(shí)data采集平臺(在線(xiàn)版)“狀態(tài)數據目錄”界面。網(wǎng)絡(luò )版平臺的版面設計參考“標準版”的版面方式,分為菜單區和工作內容區,以減少用戶(hù)的不適感。
  工作分配是對整個(gè)數據采集工作的合理安排。分為兩個(gè)階段:數據源表采集及其數據表采集,必須先完成源表的數據采集才能進(jìn)入下一階段。(比如7.1.1個(gè)專(zhuān)業(yè)表不采集好,那么后面會(huì )涉及到專(zhuān)業(yè)表,可能會(huì )出現無(wú)法選擇專(zhuān)業(yè)的情況。)設置審稿人/采集人。點(diǎn)擊管理頁(yè)面工作表記錄行“數據表負責人”欄的“設置”按鈕,打開(kāi)分配新工作負責人管理窗口(2)添加負責人點(diǎn)擊“添加人員負責” 按鈕打開(kāi)分配新負責人的管理窗口??梢詮摹安块T(mén)”下拉框中選擇部門(mén)查找要分配的用戶(hù),也可以直接在“部門(mén)”下拉框中輸入要分配的用戶(hù)的姓名/卡號在“姓名/卡號”輸入框找到它,然后勾選用戶(hù)記錄,點(diǎn)擊“添加”按鈕選擇用戶(hù),然后點(diǎn)擊“保存”按鈕完成分配。如果單擊“刪除負責人”按鈕,當前負責人權限將被刪除。同理,采集表數據負責人的分配方法參考上述說(shuō)明,只需點(diǎn)擊“數據表采集人”欄的“設置”按鈕進(jìn)行設置即可。
  操作步驟與設置reviewer 相同。(4)批量設置采集人員/審批人。點(diǎn)擊批量設置按鈕,依次選擇人員和負責人資料表,點(diǎn)擊保存完成設置。批量刪除功能,操作步驟為類(lèi)似。(5)發(fā)布工作通知。所有工作表都分配好工作計劃后,輸入“工作要求”和“完成時(shí)間”,點(diǎn)擊“發(fā)布工作通知”按鈕,完成發(fā)布工作工作通知。發(fā)布后,采集人登錄系統時(shí)會(huì )自動(dòng)彈出工作任務(wù)提示。注意:“采集其他數據表工作”和“&lt; @采集 數據源表的工作”類(lèi)似。&lt; @3.工作統計。發(fā)布 工作后,您可以在此處查看采集工作的進(jìn)度。4.狀態(tài)設置。該功能可以設置用戶(hù)是否允許采集或更改數據。(1)管理員點(diǎn)擊首頁(yè)“菜單區”的“系統設置”欄,點(diǎn)擊左側菜單“一、系統設置”下的“狀態(tài)設置”選項,打開(kāi)狀態(tài)設置管理頁(yè)面。
  稍后在補充說(shuō)明中說(shuō)明原因,點(diǎn)擊“保存...說(shuō)明”按鈕完成。9.數據上報 數據上報提供給用戶(hù)采集平臺中的狀態(tài)數據上報到教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。
  注意:頁(yè)面打開(kāi)可能需要一段時(shí)間(因為此時(shí)將生成案例研究的摘要數據),請稍候。(2)填寫(xiě)機構代碼、密碼(登錄云中心的密碼)和驗證碼,點(diǎn)擊“登錄”按鈕開(kāi)始進(jìn)入上報數據管理頁(yè)面。(3) “數據生成”將系統生成采集的狀態(tài)數據作為報告數據。選擇“年份”和“學(xué)校名稱(chēng)”后,點(diǎn)擊“生成”按鈕生成數據。(4)@ &gt; “數據上報”是將生成的數據上報到云端的“高職數據中心”,用戶(hù)可以點(diǎn)擊“上報”按鈕完成上報。注意:(1)上報時(shí),系統不應還有 ” 系統會(huì )自動(dòng)將任務(wù)變?yōu)椤斑M(jìn)行中”狀態(tài);當用戶(hù)完成data采集任務(wù)后,需要進(jìn)入該頁(yè)面點(diǎn)擊“操作”欄中的“完成”按鈕完成任務(wù),任務(wù)變?yōu)椤巴瓿伞睜顟B(tài);如果用戶(hù)任務(wù)到期前未完成任務(wù),系統會(huì )自動(dòng)變?yōu)椤拔赐瓿伞睜顟B(tài)。
  右上角按鈕,備份平臺數據庫。11.2、導出標準版說(shuō)明:如果需要將數據導出到標準版,必須先上報數據,然后登錄“中國職業(yè)教育評估”網(wǎng)站,操作在《高職院校人才培養工作狀況數據采集及管理平臺》中。日常管理包括:(1)按“工作分配”劃分,采集我負責的狀態(tài)數據;(2)默認用戶(hù)采集由系統自動(dòng)分配的狀態(tài)數據)系統(如專(zhuān)職教師,默認可以是2)默認用戶(hù)采集@采集6.表1狀態(tài)數據)。(3)數據管理員審核提交的狀態(tài)數據。注意:當用戶(hù)填寫(xiě)不在權限范圍內的狀態(tài)數據時(shí),系統會(huì )自動(dòng)提示告知。第一步:登錄系統。使用瀏覽器訪(fǎng)問(wèn)平臺網(wǎng)站。然后輸入卡號和密碼,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集和管理平臺。第 2 步:管理數據。
  勾選要編輯的記錄后,點(diǎn)擊“編輯”按鈕,打開(kāi)修改管理頁(yè)面。(2)更正相應內容后,點(diǎn)擊“保存”按鈕完成。注意:(1)如果用戶(hù)需要刪除一條記錄,可以先查看該記錄,然后點(diǎn)擊“刪除”按鈕刪除已經(jīng)過(guò)采集的狀態(tài)數據。(2)已經(jīng)審核“通過(guò)”的記錄不允許刪除。3、審核數據(1)勾選需要審核的記錄后,點(diǎn)擊“審核”按鈕,打開(kāi)審核記錄管理窗口。(2)選擇“審核結果”并填寫(xiě)“審核備注”,然后點(diǎn)擊“保存”按鈕完成。4.單一表單導入。(&lt; @1)點(diǎn)擊導入按鈕,進(jìn)入單表導入頁(yè)面。(2)點(diǎn)擊右上角下載導入的模板,將數據填入模板,導入即可。注意:?jiǎn)伪韺肟蛇x擇清空數據導入或添加數據。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清空模式導入只會(huì )清空該表。如果是擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。

采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 118 次瀏覽 ? 2022-02-13 02:01 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)
  采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便。例如在文章的編輯狀態(tài)時(shí)保存為數據庫;當查詢(xún)操作時(shí)保存為excel、表格等形式;當系統運行時(shí)保存為csv、html、json等格式...可以輕松方便管理數據庫、圖片圖形、多媒體文件、相冊視頻、郵件文檔、表格文檔、pdf文檔、網(wǎng)頁(yè)文檔等。采集管理平臺最主要的就是增加了多源數據的自動(dòng)篩選,比如想抓取php源文件,那我們直接上傳php文件,平臺自動(dòng)篩選出源文件;想抓取ruby源文件,那我們直接下載ruby源文件,平臺自動(dòng)篩選出ruby源文件;想抓取java源文件,那我們直接將java源文件下載下來(lái),平臺自動(dòng)篩選出java源文件;再想抓取excel源文件,那我們下載excel源文件,平臺自動(dòng)篩選出excel源文件;下載其他網(wǎng)頁(yè)源文件,那我們下載其他網(wǎng)頁(yè)源文件..這樣,提高了數據統計的效率。
  采集內容管理平臺是以“采集引擎”為核心,對海量數據進(jìn)行采集后處理,進(jìn)而實(shí)現“對重要數據實(shí)現強控制”的數據管理,實(shí)現對海量數據的采集與管理。采集內容管理平臺不僅可以支持單一“采集引擎”,也可以實(shí)現多個(gè)采集引擎的通力合作。
  目前主流的采集系統都有的缺點(diǎn):不支持異地采集、只支持本地訪(fǎng)問(wèn)本地采集(尤其是地區采集, 查看全部

  采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)
  采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便。例如在文章的編輯狀態(tài)時(shí)保存為數據庫;當查詢(xún)操作時(shí)保存為excel、表格等形式;當系統運行時(shí)保存為csv、html、json等格式...可以輕松方便管理數據庫、圖片圖形、多媒體文件、相冊視頻、郵件文檔、表格文檔、pdf文檔、網(wǎng)頁(yè)文檔等。采集管理平臺最主要的就是增加了多源數據的自動(dòng)篩選,比如想抓取php源文件,那我們直接上傳php文件,平臺自動(dòng)篩選出源文件;想抓取ruby源文件,那我們直接下載ruby源文件,平臺自動(dòng)篩選出ruby源文件;想抓取java源文件,那我們直接將java源文件下載下來(lái),平臺自動(dòng)篩選出java源文件;再想抓取excel源文件,那我們下載excel源文件,平臺自動(dòng)篩選出excel源文件;下載其他網(wǎng)頁(yè)源文件,那我們下載其他網(wǎng)頁(yè)源文件..這樣,提高了數據統計的效率。
  采集內容管理平臺是以“采集引擎”為核心,對海量數據進(jìn)行采集后處理,進(jìn)而實(shí)現“對重要數據實(shí)現強控制”的數據管理,實(shí)現對海量數據的采集與管理。采集內容管理平臺不僅可以支持單一“采集引擎”,也可以實(shí)現多個(gè)采集引擎的通力合作。
  目前主流的采集系統都有的缺點(diǎn):不支持異地采集、只支持本地訪(fǎng)問(wèn)本地采集(尤其是地區采集,

采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 86 次瀏覽 ? 2022-02-07 17:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)
  概述
  集嘉通達信息資源整合平臺(以下簡(jiǎn)稱(chēng)信息資源整合平臺)是基于非結構化文檔管理的大型智能內容管理系統。發(fā)布的解決方案可以同時(shí)管理文本、圖片、多媒體等信息,并提供全文檢索服務(wù)。它是一個(gè)內容管理、發(fā)布和增值利用的平臺。是各類(lèi)機構建設數字圖書(shū)館、文獻信息系統、開(kāi)發(fā)信息的平臺。服務(wù)的理想平臺。
  功能和特點(diǎn)
  集嘉通達信息資源集成平臺由管理子系統、數據采集子系統、資源數據展示系統三部分組成。
  1、管理子系統實(shí)現了添加、修改、刪除、發(fā)布資源的一整套流程功能;
  2、data采集子系統實(shí)現參與單位數據的批量采集和數據過(guò)濾功能;
  3、資源數據展示系統實(shí)現資源統一檢索、資源數據多樣化展示、資源在線(xiàn)瀏覽、資源下載等,同時(shí)對資源和訪(fǎng)問(wèn)量進(jìn)行分析,形成報表。
  集嘉通達信息資源整合平臺具有以下五個(gè)功能特點(diǎn):
  1、資源全覆蓋,可以整合整合各種形式的信息資源,格式不限,如文字、圖片、多媒體等格式的信息;
  2、檢索方便,平臺上,一鍵檢索可以找到精準的信息資源;
  3、檢索速度快,利用大數據檢索技術(shù)可實(shí)現1s內數據檢索;
  4、應用方式多樣,系統提供關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、資源智能關(guān)聯(lián)、熱搜詞推薦等功能;
  5、靈活的資源庫和資源配置,更易于擴展和維護。
  適用對象及案例
  適用對象一:政府機關(guān)、科研院所等機構、學(xué)校、圖書(shū)館及事業(yè)單位;
  適用對象二:某一領(lǐng)域的平臺型、服務(wù)型企業(yè)或機構;
  適用對象三:其他有信息資源整合和信息資源檢索需求的企事業(yè)單位。
  應用案例:北京體育大學(xué)、北京盲文圖書(shū)館、中國船舶重工集團公司第714研究所、長(cháng)春航空航天大學(xué)、西南大學(xué)。
  應用場(chǎng)景
  信息資源整合平臺的應用行業(yè)不受限制,場(chǎng)景主要集中在企業(yè)和行業(yè)的信息整合和信息檢索,包括但不限于以下場(chǎng)景。
  場(chǎng)景一:建設學(xué)校圖書(shū)館信息資源整合平臺
  學(xué)校圖書(shū)館藏書(shū)、文獻、期刊種類(lèi)繁多,數量龐大,形式多樣,包括電子書(shū)和實(shí)體書(shū)。同時(shí),在平臺的使用中,也有很多功能需求,一般包括增加書(shū)籍、修改書(shū)籍、刪除書(shū)籍、統計書(shū)籍等;找書(shū)、借書(shū)、還書(shū)、借書(shū)統計;申請讀卡、刪除讀卡、修改讀卡;添加管理員、修改管理員信息、刪除管理員等。
  集家通達信息資源整合平臺可同時(shí)管理文字、圖片、多媒體等信息,提供全文檢索服務(wù)。系統按照標準規范構建,具有多種檢索方式。它是用于內容管理、發(fā)布和增值利用的信息資源。綜合平臺。
  場(chǎng)景二:行業(yè)平臺建設——CNKI、學(xué)信、錢(qián)途等
  行業(yè)信息資源的整合利用變得越來(lái)越有價(jià)值。各行各業(yè)都有自己的行業(yè)信息資源整合平臺,如學(xué)術(shù)文獻領(lǐng)域的CNKI、學(xué)歷證書(shū)領(lǐng)域的學(xué)信、設計與辦公領(lǐng)域的千圖等。行業(yè)平臺整合行業(yè)資源,形成資源門(mén)戶(hù)網(wǎng)站,從而獲取客戶(hù),為客戶(hù)提供統一的一、快速精準的資源搜索和下載服務(wù)。
  價(jià)值
  5.1 整合企事業(yè)單位內部信息,加強部門(mén)間信息交流
  大型企事業(yè)單位,部門(mén)多,容易出現“信息孤島”現象。部門(mén)之間的信息無(wú)法相互溝通。有多個(gè)接口采集,重復輸入,重復工作,導致信息缺乏一致性。即使部門(mén)之間有共享機制,操作也可能缺乏及時(shí)性和便利性,導致部門(mén)間信息利用率低,效率低,影響業(yè)務(wù)的順利開(kāi)展。
  集嘉信息資源整合平臺可以整合各部門(mén)的數據信息,不限制數據格式,如文字、圖片、多媒體等。平臺提供多種檢索方式,1s可實(shí)現數據檢索,檢索結果快速、簡(jiǎn)便、準確,提高部門(mén)工作效率。
  5.2 企業(yè)或機構信息整合提升外部客戶(hù)服務(wù)質(zhì)量
  擁有龐大客戶(hù)群的企業(yè)或機構,每天可能有大量客戶(hù)在自己的平臺上進(jìn)行信息檢索服務(wù),這對平臺-系統安全要求、建設標準和規范要求、信息資源處理要求等提出了很高的要求。 ,信息檢索和呈現的要求。
  集嘉信息資源集成平臺具有優(yōu)秀的系統安全措施建設、信息資源標準規范建設(模板管理、用戶(hù)分級管理等)、科學(xué)的數據處理建設、各種檢索和信息展示的功能應用,如關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、熱搜詞推薦等,為客戶(hù)提供快速、準確、便捷的搜索體驗。
  5.3 科研、高校單位整合本領(lǐng)域信息,提升科研水平
  有科研項目的企事業(yè)單位,或擁有龐大信息資源的單位或機構,如科研院所、高校等,信息使用者可以通過(guò)信息資源整合平臺直接、快捷、方便地檢索和提取自己的信息. 所需的信息可以大大提高效率。 查看全部

  采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)
  概述
  集嘉通達信息資源整合平臺(以下簡(jiǎn)稱(chēng)信息資源整合平臺)是基于非結構化文檔管理的大型智能內容管理系統。發(fā)布的解決方案可以同時(shí)管理文本、圖片、多媒體等信息,并提供全文檢索服務(wù)。它是一個(gè)內容管理、發(fā)布和增值利用的平臺。是各類(lèi)機構建設數字圖書(shū)館、文獻信息系統、開(kāi)發(fā)信息的平臺。服務(wù)的理想平臺。
  功能和特點(diǎn)
  集嘉通達信息資源集成平臺由管理子系統、數據采集子系統、資源數據展示系統三部分組成。
  1、管理子系統實(shí)現了添加、修改、刪除、發(fā)布資源的一整套流程功能;
  2、data采集子系統實(shí)現參與單位數據的批量采集和數據過(guò)濾功能;
  3、資源數據展示系統實(shí)現資源統一檢索、資源數據多樣化展示、資源在線(xiàn)瀏覽、資源下載等,同時(shí)對資源和訪(fǎng)問(wèn)量進(jìn)行分析,形成報表。
  集嘉通達信息資源整合平臺具有以下五個(gè)功能特點(diǎn):
  1、資源全覆蓋,可以整合整合各種形式的信息資源,格式不限,如文字、圖片、多媒體等格式的信息;
  2、檢索方便,平臺上,一鍵檢索可以找到精準的信息資源;
  3、檢索速度快,利用大數據檢索技術(shù)可實(shí)現1s內數據檢索;
  4、應用方式多樣,系統提供關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、資源智能關(guān)聯(lián)、熱搜詞推薦等功能;
  5、靈活的資源庫和資源配置,更易于擴展和維護。
  適用對象及案例
  適用對象一:政府機關(guān)、科研院所等機構、學(xué)校、圖書(shū)館及事業(yè)單位;
  適用對象二:某一領(lǐng)域的平臺型、服務(wù)型企業(yè)或機構;
  適用對象三:其他有信息資源整合和信息資源檢索需求的企事業(yè)單位。
  應用案例:北京體育大學(xué)、北京盲文圖書(shū)館、中國船舶重工集團公司第714研究所、長(cháng)春航空航天大學(xué)、西南大學(xué)。
  應用場(chǎng)景
  信息資源整合平臺的應用行業(yè)不受限制,場(chǎng)景主要集中在企業(yè)和行業(yè)的信息整合和信息檢索,包括但不限于以下場(chǎng)景。
  場(chǎng)景一:建設學(xué)校圖書(shū)館信息資源整合平臺
  學(xué)校圖書(shū)館藏書(shū)、文獻、期刊種類(lèi)繁多,數量龐大,形式多樣,包括電子書(shū)和實(shí)體書(shū)。同時(shí),在平臺的使用中,也有很多功能需求,一般包括增加書(shū)籍、修改書(shū)籍、刪除書(shū)籍、統計書(shū)籍等;找書(shū)、借書(shū)、還書(shū)、借書(shū)統計;申請讀卡、刪除讀卡、修改讀卡;添加管理員、修改管理員信息、刪除管理員等。
  集家通達信息資源整合平臺可同時(shí)管理文字、圖片、多媒體等信息,提供全文檢索服務(wù)。系統按照標準規范構建,具有多種檢索方式。它是用于內容管理、發(fā)布和增值利用的信息資源。綜合平臺。
  場(chǎng)景二:行業(yè)平臺建設——CNKI、學(xué)信、錢(qián)途等
  行業(yè)信息資源的整合利用變得越來(lái)越有價(jià)值。各行各業(yè)都有自己的行業(yè)信息資源整合平臺,如學(xué)術(shù)文獻領(lǐng)域的CNKI、學(xué)歷證書(shū)領(lǐng)域的學(xué)信、設計與辦公領(lǐng)域的千圖等。行業(yè)平臺整合行業(yè)資源,形成資源門(mén)戶(hù)網(wǎng)站,從而獲取客戶(hù),為客戶(hù)提供統一的一、快速精準的資源搜索和下載服務(wù)。
  價(jià)值
  5.1 整合企事業(yè)單位內部信息,加強部門(mén)間信息交流
  大型企事業(yè)單位,部門(mén)多,容易出現“信息孤島”現象。部門(mén)之間的信息無(wú)法相互溝通。有多個(gè)接口采集,重復輸入,重復工作,導致信息缺乏一致性。即使部門(mén)之間有共享機制,操作也可能缺乏及時(shí)性和便利性,導致部門(mén)間信息利用率低,效率低,影響業(yè)務(wù)的順利開(kāi)展。
  集嘉信息資源整合平臺可以整合各部門(mén)的數據信息,不限制數據格式,如文字、圖片、多媒體等。平臺提供多種檢索方式,1s可實(shí)現數據檢索,檢索結果快速、簡(jiǎn)便、準確,提高部門(mén)工作效率。
  5.2 企業(yè)或機構信息整合提升外部客戶(hù)服務(wù)質(zhì)量
  擁有龐大客戶(hù)群的企業(yè)或機構,每天可能有大量客戶(hù)在自己的平臺上進(jìn)行信息檢索服務(wù),這對平臺-系統安全要求、建設標準和規范要求、信息資源處理要求等提出了很高的要求。 ,信息檢索和呈現的要求。
  集嘉信息資源集成平臺具有優(yōu)秀的系統安全措施建設、信息資源標準規范建設(模板管理、用戶(hù)分級管理等)、科學(xué)的數據處理建設、各種檢索和信息展示的功能應用,如關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、熱搜詞推薦等,為客戶(hù)提供快速、準確、便捷的搜索體驗。
  5.3 科研、高校單位整合本領(lǐng)域信息,提升科研水平
  有科研項目的企事業(yè)單位,或擁有龐大信息資源的單位或機構,如科研院所、高校等,信息使用者可以通過(guò)信息資源整合平臺直接、快捷、方便地檢索和提取自己的信息. 所需的信息可以大大提高效率。

采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 104 次瀏覽 ? 2022-02-06 16:00 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))
  采集內容管理平臺,可以根據類(lèi)型收集各類(lèi)數據,簡(jiǎn)單易用,操作靈活,可自定義語(yǔ)言和數據庫管理后臺等。如何接入采集功能1.加群,聯(lián)系助理,注明采集內容管理平臺(有專(zhuān)門(mén)的qq群,可加入或私聊助理)2.在公眾號內編輯,內容及注意事項:2.1推薦文章,(推薦的文章內容須是公眾號本身定位相關(guān)的,若某篇文章為廣告軟文,請勿推薦)2.2優(yōu)質(zhì)文章,(含自定義語(yǔ)言?xún)热莸奈恼拢?.3自動(dòng)發(fā)布內容,(可以使用采集工具,如:xml工具等)2.4.點(diǎn)擊接收,輸入接收地址即可發(fā)送到采集平臺,無(wú)需加群。
  2.5.登錄采集后臺,并設置好采集內容類(lèi)型等,2.6.填寫(xiě)電話(huà)號碼及個(gè)人身份信息后,手機驗證方可使用接收功能3.關(guān)注采集微信號后(公眾號、個(gè)人號均可),點(diǎn)擊接收原文鏈接(需采集文章后臺設置為公眾號推薦),可以自定義輸入語(yǔ)言,并對該文章進(jìn)行點(diǎn)擊搜索,只要符合條件,即可直接搜索,不需要另外下載采集工具(搜狗或iis等)。
  4.請用手機號注冊,安卓的需要注冊,請配置手機號綁定登錄。接收平臺自動(dòng)發(fā)送到你微信號的接收地址5.請專(zhuān)注于采集,禁止添加諸如學(xué)習、交流、交友等功能,接收平臺發(fā)送文章,一經(jīng)審核,拒絕接收。接收地址:.網(wǎng)站采集接收更方便,但需要注冊帳號,默認為網(wǎng)站鏈接。安卓的可以對接手機號,ios的可以對接手機號驗證??梢蕴D中文全文閱讀,但全文不支持接收文字。信息安全方面,xml采集工具防止偽造是我們的主要優(yōu)勢。 查看全部

  采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))
  采集內容管理平臺,可以根據類(lèi)型收集各類(lèi)數據,簡(jiǎn)單易用,操作靈活,可自定義語(yǔ)言和數據庫管理后臺等。如何接入采集功能1.加群,聯(lián)系助理,注明采集內容管理平臺(有專(zhuān)門(mén)的qq群,可加入或私聊助理)2.在公眾號內編輯,內容及注意事項:2.1推薦文章,(推薦的文章內容須是公眾號本身定位相關(guān)的,若某篇文章為廣告軟文,請勿推薦)2.2優(yōu)質(zhì)文章,(含自定義語(yǔ)言?xún)热莸奈恼拢?.3自動(dòng)發(fā)布內容,(可以使用采集工具,如:xml工具等)2.4.點(diǎn)擊接收,輸入接收地址即可發(fā)送到采集平臺,無(wú)需加群。
  2.5.登錄采集后臺,并設置好采集內容類(lèi)型等,2.6.填寫(xiě)電話(huà)號碼及個(gè)人身份信息后,手機驗證方可使用接收功能3.關(guān)注采集微信號后(公眾號、個(gè)人號均可),點(diǎn)擊接收原文鏈接(需采集文章后臺設置為公眾號推薦),可以自定義輸入語(yǔ)言,并對該文章進(jìn)行點(diǎn)擊搜索,只要符合條件,即可直接搜索,不需要另外下載采集工具(搜狗或iis等)。
  4.請用手機號注冊,安卓的需要注冊,請配置手機號綁定登錄。接收平臺自動(dòng)發(fā)送到你微信號的接收地址5.請專(zhuān)注于采集,禁止添加諸如學(xué)習、交流、交友等功能,接收平臺發(fā)送文章,一經(jīng)審核,拒絕接收。接收地址:.網(wǎng)站采集接收更方便,但需要注冊帳號,默認為網(wǎng)站鏈接。安卓的可以對接手機號,ios的可以對接手機號驗證??梢蕴D中文全文閱讀,但全文不支持接收文字。信息安全方面,xml采集工具防止偽造是我們的主要優(yōu)勢。

采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 116 次瀏覽 ? 2022-02-06 11:01 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)
  采集內容管理平臺在實(shí)際項目中主要提供:采集數據,批量生成分析報表,建立數據庫操作環(huán)境:windows/linux效果展示:采集本地數據:采集公眾號文章的url地址需要完整源碼的小伙伴,可以去公眾號下載獲取完整源碼還有其他好玩的干貨文章,
  可以使用odoo數據庫系統哦,odoo1.5.0revision1.2版本新增功能已經(jīng)跟上了,對采集用戶(hù)的限制也很小~準確的說(shuō),是odoo使用hadoop從mysql讀取數據。使用建議可以看看1.5.0中的新功能,通過(guò)使用url鏈接可以快速查看和更新采集到的結果,有更豐富的查詢(xún)形式。相關(guān)推薦odoo建模|odoo發(fā)布20000條數據告訴你哪些數據采集是穩妥的隨時(shí)隨地開(kāi)啟數據采集看得見(jiàn),也得到!。
  采集本地數據:你可以在你想采集的地方粘貼鏈接,
  1.2版本添加了url獲取功能,以上一段截圖僅供參考,采集對象需要修改后才能繼續使用。以下截圖截至20180725處:獲取完整采集數據的步驟:1.采集url和參數2.修改配置信息3.參數上傳、修改4.fileformat轉換配置信息5.上傳圖片至服務(wù)器注意:1.關(guān)于采集url:在odoo官網(wǎng)上下載最新版本,在firefox瀏覽器中打開(kāi),或手機瀏覽器打開(kāi)。
  2.采集頁(yè)面:在provider中選擇登錄賬號和密碼,然后將頁(yè)面的url傳遞到服務(wù)器中。特別說(shuō)明:odoo1.3版本已經(jīng)新增了url寫(xiě)入數據庫功能,但是各位可能還是會(huì )提示在配置頁(yè)面中顯示采集出錯的提示,這個(gè)時(shí)候可以嘗試改變provider的url獲取方式,將url導入數據庫中,這樣就不會(huì )顯示數據庫中的url了。 查看全部

  采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)
  采集內容管理平臺在實(shí)際項目中主要提供:采集數據,批量生成分析報表,建立數據庫操作環(huán)境:windows/linux效果展示:采集本地數據:采集公眾號文章的url地址需要完整源碼的小伙伴,可以去公眾號下載獲取完整源碼還有其他好玩的干貨文章,
  可以使用odoo數據庫系統哦,odoo1.5.0revision1.2版本新增功能已經(jīng)跟上了,對采集用戶(hù)的限制也很小~準確的說(shuō),是odoo使用hadoop從mysql讀取數據。使用建議可以看看1.5.0中的新功能,通過(guò)使用url鏈接可以快速查看和更新采集到的結果,有更豐富的查詢(xún)形式。相關(guān)推薦odoo建模|odoo發(fā)布20000條數據告訴你哪些數據采集是穩妥的隨時(shí)隨地開(kāi)啟數據采集看得見(jiàn),也得到!。
  采集本地數據:你可以在你想采集的地方粘貼鏈接,
  1.2版本添加了url獲取功能,以上一段截圖僅供參考,采集對象需要修改后才能繼續使用。以下截圖截至20180725處:獲取完整采集數據的步驟:1.采集url和參數2.修改配置信息3.參數上傳、修改4.fileformat轉換配置信息5.上傳圖片至服務(wù)器注意:1.關(guān)于采集url:在odoo官網(wǎng)上下載最新版本,在firefox瀏覽器中打開(kāi),或手機瀏覽器打開(kāi)。
  2.采集頁(yè)面:在provider中選擇登錄賬號和密碼,然后將頁(yè)面的url傳遞到服務(wù)器中。特別說(shuō)明:odoo1.3版本已經(jīng)新增了url寫(xiě)入數據庫功能,但是各位可能還是會(huì )提示在配置頁(yè)面中顯示采集出錯的提示,這個(gè)時(shí)候可以嘗試改變provider的url獲取方式,將url導入數據庫中,這樣就不會(huì )顯示數據庫中的url了。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 131 次瀏覽 ? 2022-02-05 03:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述是“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。以分析報告為契機,可以根據需要對開(kāi)發(fā)團隊進(jìn)行培訓,身邊的案例可以更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述是“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。以分析報告為契機,可以根據需要對開(kāi)發(fā)團隊進(jìn)行培訓,身邊的案例可以更有說(shuō)服力。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 156 次瀏覽 ? 2022-01-30 13:07 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 117 次瀏覽 ? 2022-01-30 13:06 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))
  模塊劃分
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  五、數據采集
  采集內容
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的信息,基本上所有需要的信息都可以采集獲得;MySQL 函數相對能采集獲取的信息較少。
  表中的“復選標記+星號”表示非預定作業(yè)已完成,但稍后從圖書(shū)館實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  六、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,會(huì )更清楚。從分類(lèi)的角度來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,您也可以對規則有一個(gè)清晰的了解。
  規則定義(對象級別)
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置規則很多。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是通過(guò)規則的輸入參數來(lái)確認的。參數包括表記錄數和表的物理大小。該規則的一般描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是直接從AWR中按時(shí)間段提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是通過(guò)使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中。今天整個(gè)審計平臺,除了連接pt工具的部分,使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  七、平臺實(shí)現
  規則執行
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  第二張圖是代碼實(shí)現的總結。
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。這主要是關(guān)于資源的消耗。
  八、系統管理
  規則管理
  在介紹了一些界面之后,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  配置好規則后,就可以在這里完成任務(wù)發(fā)布的工作了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的時(shí)序策略還是以天為單位,所以不能選擇當天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計的類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計持續時(shí)間會(huì )有所不同,通常在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作已完成,可以查看或導出審計結果。
  九、結果展示
  對象審計結果概述
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審查對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我們擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  這部分是對象審計的詳細部分。對應每條規則的詳細狀態(tài),您可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  將顯示執行計劃這一部分的概覽,類(lèi)似于主題的狀態(tài)。也是每條規則的扣減狀態(tài)。
  執行計劃審核結果詳情
  這部分是執行計劃的詳細部分。
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。要約一個(gè)小的知識庫,便于開(kāi)發(fā)者優(yōu)化。后期平臺二期會(huì )做更精準的優(yōu)化引擎部分,并擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA 可以根據這些信息做出一些初步的優(yōu)化判斷。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  十、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  十一、驅動(dòng)進(jìn)程
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,減輕了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統運行狀況,掌握第一手資料??焖倭私飧鱾€(gè)業(yè)務(wù)系統的質(zhì)量并進(jìn)行試點(diǎn)選型。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報狀態(tài)。以分析報告為契機,可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))
  模塊劃分
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  五、數據采集
  采集內容
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的信息,基本上所有需要的信息都可以采集獲得;MySQL 函數相對能采集獲取的信息較少。
  表中的“復選標記+星號”表示非預定作業(yè)已完成,但稍后從圖書(shū)館實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  六、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,會(huì )更清楚。從分類(lèi)的角度來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,您也可以對規則有一個(gè)清晰的了解。
  規則定義(對象級別)
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置規則很多。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是通過(guò)規則的輸入參數來(lái)確認的。參數包括表記錄數和表的物理大小。該規則的一般描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是直接從AWR中按時(shí)間段提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是通過(guò)使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中。今天整個(gè)審計平臺,除了連接pt工具的部分,使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  七、平臺實(shí)現
  規則執行
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  第二張圖是代碼實(shí)現的總結。
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。這主要是關(guān)于資源的消耗。
  八、系統管理
  規則管理
  在介紹了一些界面之后,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  配置好規則后,就可以在這里完成任務(wù)發(fā)布的工作了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的時(shí)序策略還是以天為單位,所以不能選擇當天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計的類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計持續時(shí)間會(huì )有所不同,通常在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作已完成,可以查看或導出審計結果。
  九、結果展示
  對象審計結果概述
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審查對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我們擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  這部分是對象審計的詳細部分。對應每條規則的詳細狀態(tài),您可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  將顯示執行計劃這一部分的概覽,類(lèi)似于主題的狀態(tài)。也是每條規則的扣減狀態(tài)。
  執行計劃審核結果詳情
  這部分是執行計劃的詳細部分。
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。要約一個(gè)小的知識庫,便于開(kāi)發(fā)者優(yōu)化。后期平臺二期會(huì )做更精準的優(yōu)化引擎部分,并擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA 可以根據這些信息做出一些初步的優(yōu)化判斷。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  十、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  十一、驅動(dòng)進(jìn)程
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,減輕了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統運行狀況,掌握第一手資料??焖倭私飧鱾€(gè)業(yè)務(wù)系統的質(zhì)量并進(jìn)行試點(diǎn)選型。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報狀態(tài)。以分析報告為契機,可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 368 次瀏覽 ? 2022-01-30 13:03 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集 采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則解析總結說(shuō)明
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle 部分也以 json 格式存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現規則實(shí)現
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示對象審核結果概覽
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已為多個(gè)系統提供審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集 采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則解析總結說(shuō)明
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle 部分也以 json 格式存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現規則實(shí)現
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示對象審核結果概覽
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已為多個(gè)系統提供審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 151 次瀏覽 ? 2022-01-30 02:19 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)
  SXcms是一個(gè)基于平臺的網(wǎng)站內容管理系統,默認支持SQLServer數據庫,可以擴展支持Access、MySQL、Oracle等數據庫。
  類(lèi)似軟件
  印記
  軟件地址
  后臺執行任務(wù):頁(yè)面生成、采集等任務(wù)在后臺執行,無(wú)需打開(kāi)網(wǎng)頁(yè)等待,節省您的工作時(shí)間
  原型模塊:自由擴展列字段和參數,滿(mǎn)足您的網(wǎng)站特殊定制,擴展您的個(gè)性化應用規劃任務(wù)
  它可以在固定的時(shí)間和周期內更新整個(gè)或部分列或其他任務(wù),從而實(shí)現網(wǎng)站無(wú)人值守
  基礎數據:統一管理系統基礎數據,自由添加,自由調用,支持配置權限,讓你的網(wǎng)站更靈活
  權限管理:按角色和用戶(hù)組劃分會(huì )員權限,對站內各欄目和功能靈活分配權限,方便多人使用
  話(huà)題管理:支持話(huà)題管理、話(huà)題分類(lèi)、支持內容推薦、關(guān)鍵詞搜索內容和推送話(huà)題等功能
  模板標簽:OOP思想,調用簡(jiǎn)潔明了,標簽形式靈活,支持動(dòng)態(tài)標簽,支持多層嵌套;全站支持動(dòng)靜態(tài)切換
  數據采集:靈活設置各種采集規則和參數,可設計自動(dòng)任務(wù)計劃采集,可裁剪采集圖片加水,支持采集內容&lt; @關(guān)鍵詞替換
  網(wǎng)頁(yè)防篡改:對網(wǎng)站生成的頁(yè)面進(jìn)行保護,遇到非法篡改時(shí)自動(dòng)糾正,讓您再也不用擔心網(wǎng)頁(yè)被掛了。
  通行證:可以通過(guò)外服系統實(shí)現會(huì )員準入,內置國內主流論壇或其他系統準入模塊,讓您的會(huì )員一站通行。 查看全部

  采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)
  SXcms是一個(gè)基于平臺的網(wǎng)站內容管理系統,默認支持SQLServer數據庫,可以擴展支持Access、MySQL、Oracle等數據庫。
  類(lèi)似軟件
  印記
  軟件地址
  后臺執行任務(wù):頁(yè)面生成、采集等任務(wù)在后臺執行,無(wú)需打開(kāi)網(wǎng)頁(yè)等待,節省您的工作時(shí)間
  原型模塊:自由擴展列字段和參數,滿(mǎn)足您的網(wǎng)站特殊定制,擴展您的個(gè)性化應用規劃任務(wù)
  它可以在固定的時(shí)間和周期內更新整個(gè)或部分列或其他任務(wù),從而實(shí)現網(wǎng)站無(wú)人值守
  基礎數據:統一管理系統基礎數據,自由添加,自由調用,支持配置權限,讓你的網(wǎng)站更靈活
  權限管理:按角色和用戶(hù)組劃分會(huì )員權限,對站內各欄目和功能靈活分配權限,方便多人使用
  話(huà)題管理:支持話(huà)題管理、話(huà)題分類(lèi)、支持內容推薦、關(guān)鍵詞搜索內容和推送話(huà)題等功能
  模板標簽:OOP思想,調用簡(jiǎn)潔明了,標簽形式靈活,支持動(dòng)態(tài)標簽,支持多層嵌套;全站支持動(dòng)靜態(tài)切換
  數據采集:靈活設置各種采集規則和參數,可設計自動(dòng)任務(wù)計劃采集,可裁剪采集圖片加水,支持采集內容&lt; @關(guān)鍵詞替換
  網(wǎng)頁(yè)防篡改:對網(wǎng)站生成的頁(yè)面進(jìn)行保護,遇到非法篡改時(shí)自動(dòng)糾正,讓您再也不用擔心網(wǎng)頁(yè)被掛了。
  通行證:可以通過(guò)外服系統實(shí)現會(huì )員準入,內置國內主流論壇或其他系統準入模塊,讓您的會(huì )員一站通行。

采集內容管理平臺( Excel模板導入支持統一的模板化配置,幫你解決 )

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 169 次瀏覽 ? 2022-01-28 06:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(
Excel模板導入支持統一的模板化配置,幫你解決
)
  Smartbi:統一Excel模板配置,讓批量數據采集補充記錄簡(jiǎn)單高效!
  
  Smartbi2022-01-26
  企業(yè)的數據源多種多樣,有的需要一線(xiàn)員工采集實(shí)時(shí)存儲在Excel文件中,然后由技術(shù)人員通過(guò)批量補充記錄上傳到業(yè)務(wù)數據庫中,供后續數據分析。
  比如某行的業(yè)務(wù)員采集時(shí)不時(shí)填寫(xiě)客戶(hù)的公司名稱(chēng)、客戶(hù)代碼、地區、內部交易等基本客戶(hù)信息,然后依靠IT人員填寫(xiě)上傳到業(yè)務(wù)數據庫。這些采集對補充記錄和補充記錄的要求并不復雜,但在實(shí)際操作中可能會(huì )遇到補充記錄不及時(shí)、數據不完整等問(wèn)題,給相關(guān)數據采集人員帶來(lái)麻煩,技術(shù)人員及其數據分析師。
  
  
  
  針對以上問(wèn)題,Smartbi提供批量數據采集功能——Excel模板導入幫你解決!允許數據采集補充人員通過(guò)統一的模板配置,一鍵批量導入Excel文件中的數據,并補充錄入數據庫。既減輕了開(kāi)發(fā)人員的工作量,又滿(mǎn)足了業(yè)務(wù)人員對數據采集的需求,讓批量導入Excel數據變得簡(jiǎn)單高效。
  我們來(lái)看看這個(gè)功能是如何滿(mǎn)足用戶(hù)需求的:
  1、模板配置
  Excel模板導入支持統一模板化配置。技術(shù)人員首先通過(guò)可視化操作實(shí)現Excel模板與數據庫表的映射關(guān)系,支持綁定列、驗證規則設置、數據插入和更新選擇等,并上傳采集Excel模板文件進(jìn)行補充數據,讓業(yè)務(wù)人員可以下載并填寫(xiě)數據。
  
  2、支持綁定形式
  Excel 導入模板支持綁定到電子表格。通過(guò)綁定表格,可以導入報表數據,可以導入固定值、系統值、參數值等,還可以實(shí)現動(dòng)態(tài)數據更新導入。
  例如,用戶(hù)要下載的補充記錄模板已經(jīng)收錄了一些填寫(xiě)好的數據(如公司代碼、公司名稱(chēng)、客戶(hù)代碼、業(yè)務(wù)分類(lèi)等),這部分現有數據可能會(huì )動(dòng)態(tài)變化。如果切換不同的業(yè)務(wù)分類(lèi)參數,下載的數據是不同的。實(shí)際上,用戶(hù)只需要根據已有數據填寫(xiě)“線(xiàn)路類(lèi)型”和“是否交易”字段的數據即可。
  這時(shí)候我們可以在配置模板的時(shí)候選擇創(chuàng )建一個(gè)電子表格作為Excel模板,這樣在下載模板的時(shí)候就可以選擇報表的參數,下載不同的數據模板。
  
  3、統一管理
  管理員統一配置和管理Excel模板,并可以通過(guò)資源授權將導入模板授權給相關(guān)用戶(hù)。只有有權限的用戶(hù)才能進(jìn)行導入操作,方便用戶(hù)填寫(xiě)導入。
  
  4、一鍵導入
  技術(shù)人員配置模板并授權給填充人員后,填充人員可以下載模板和采集數據。當數據采集完成后,可以點(diǎn)擊上傳,完成數據補錄操作。簡(jiǎn)單的。
  
  導入成功或失敗都有明確的提示。如果導入失敗,用戶(hù)可以下載異常數據,查看具體數據和導入失敗的原因。
  5、不錯的擴展
  Smartbi的Excel模板導入功能支持擴展接口,可以幫助用戶(hù)通過(guò)Java類(lèi)實(shí)現自定義數據處理需求或規則驗證需求。
  在實(shí)際的補錄操作中,客戶(hù)也可能有定制化的數據處理或規則驗證需求,比如判斷兩個(gè)指標的值是否相等。如果指標不相等,則驗證失敗,如果有相關(guān)提示信息,可以通過(guò)自定義規則驗證類(lèi)來(lái)實(shí)現這個(gè)需求。
   查看全部

  采集內容管理平臺(
Excel模板導入支持統一的模板化配置,幫你解決
)
  Smartbi:統一Excel模板配置,讓批量數據采集補充記錄簡(jiǎn)單高效!
  
  Smartbi2022-01-26
  企業(yè)的數據源多種多樣,有的需要一線(xiàn)員工采集實(shí)時(shí)存儲在Excel文件中,然后由技術(shù)人員通過(guò)批量補充記錄上傳到業(yè)務(wù)數據庫中,供后續數據分析。
  比如某行的業(yè)務(wù)員采集時(shí)不時(shí)填寫(xiě)客戶(hù)的公司名稱(chēng)、客戶(hù)代碼、地區、內部交易等基本客戶(hù)信息,然后依靠IT人員填寫(xiě)上傳到業(yè)務(wù)數據庫。這些采集對補充記錄和補充記錄的要求并不復雜,但在實(shí)際操作中可能會(huì )遇到補充記錄不及時(shí)、數據不完整等問(wèn)題,給相關(guān)數據采集人員帶來(lái)麻煩,技術(shù)人員及其數據分析師。
  
  
  
  針對以上問(wèn)題,Smartbi提供批量數據采集功能——Excel模板導入幫你解決!允許數據采集補充人員通過(guò)統一的模板配置,一鍵批量導入Excel文件中的數據,并補充錄入數據庫。既減輕了開(kāi)發(fā)人員的工作量,又滿(mǎn)足了業(yè)務(wù)人員對數據采集的需求,讓批量導入Excel數據變得簡(jiǎn)單高效。
  我們來(lái)看看這個(gè)功能是如何滿(mǎn)足用戶(hù)需求的:
  1、模板配置
  Excel模板導入支持統一模板化配置。技術(shù)人員首先通過(guò)可視化操作實(shí)現Excel模板與數據庫表的映射關(guān)系,支持綁定列、驗證規則設置、數據插入和更新選擇等,并上傳采集Excel模板文件進(jìn)行補充數據,讓業(yè)務(wù)人員可以下載并填寫(xiě)數據。
  
  2、支持綁定形式
  Excel 導入模板支持綁定到電子表格。通過(guò)綁定表格,可以導入報表數據,可以導入固定值、系統值、參數值等,還可以實(shí)現動(dòng)態(tài)數據更新導入。
  例如,用戶(hù)要下載的補充記錄模板已經(jīng)收錄了一些填寫(xiě)好的數據(如公司代碼、公司名稱(chēng)、客戶(hù)代碼、業(yè)務(wù)分類(lèi)等),這部分現有數據可能會(huì )動(dòng)態(tài)變化。如果切換不同的業(yè)務(wù)分類(lèi)參數,下載的數據是不同的。實(shí)際上,用戶(hù)只需要根據已有數據填寫(xiě)“線(xiàn)路類(lèi)型”和“是否交易”字段的數據即可。
  這時(shí)候我們可以在配置模板的時(shí)候選擇創(chuàng )建一個(gè)電子表格作為Excel模板,這樣在下載模板的時(shí)候就可以選擇報表的參數,下載不同的數據模板。
  
  3、統一管理
  管理員統一配置和管理Excel模板,并可以通過(guò)資源授權將導入模板授權給相關(guān)用戶(hù)。只有有權限的用戶(hù)才能進(jìn)行導入操作,方便用戶(hù)填寫(xiě)導入。
  
  4、一鍵導入
  技術(shù)人員配置模板并授權給填充人員后,填充人員可以下載模板和采集數據。當數據采集完成后,可以點(diǎn)擊上傳,完成數據補錄操作。簡(jiǎn)單的。
  
  導入成功或失敗都有明確的提示。如果導入失敗,用戶(hù)可以下載異常數據,查看具體數據和導入失敗的原因。
  5、不錯的擴展
  Smartbi的Excel模板導入功能支持擴展接口,可以幫助用戶(hù)通過(guò)Java類(lèi)實(shí)現自定義數據處理需求或規則驗證需求。
  在實(shí)際的補錄操作中,客戶(hù)也可能有定制化的數據處理或規則驗證需求,比如判斷兩個(gè)指標的值是否相等。如果指標不相等,則驗證失敗,如果有相關(guān)提示信息,可以通過(guò)自定義規則驗證類(lèi)來(lái)實(shí)現這個(gè)需求。
  

采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 125 次瀏覽 ? 2022-01-23 20:04 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)
  采集內容管理平臺,國內領(lǐng)先的pc+app采集服務(wù)平臺云采。這是在網(wǎng)絡(luò )信息大爆炸,注意力捉摸不透的今天,利用互聯(lián)網(wǎng)的云技術(shù),結合移動(dòng)端,輕松采集信息。
  這一段時(shí)間在業(yè)余學(xué)習django,簡(jiǎn)單總結一下學(xué)習路線(xiàn)吧:采集主要分為圖片采集、視頻采集、音頻采集,其中圖片采集一般在pc端,也就是坐在電腦前面,通過(guò)瀏覽器查看采集軟件的文件查看,視頻采集一般在手機上,也是用瀏覽器采集,音頻采集很麻煩,是自動(dòng)循環(huán)播放音頻,一般都是直接下載!至于什么樣的軟件,一般百度、阿里都會(huì )有相應的采集軟件,例如圖片采集的推薦url500、音頻采集推薦多采寶app,技術(shù)好的話(huà),你可以去學(xué)習下,都很容易上手!。
  中國采集網(wǎng)。不過(guò)這個(gè)我沒(méi)有用過(guò),
  接著(zhù)樓上的話(huà)題,補充一個(gè):中國采集網(wǎng)推薦原因1,國內數據質(zhì)量相對較高接著(zhù)討論每日站長(cháng)平臺需要的功能,數據質(zhì)量不容小覷。
  業(yè)余開(kāi)發(fā)還是php+mysql+java,php+mysql+redis+drupal比較適合業(yè)余開(kāi)發(fā),這樣不用引入一些費力不討好的框架和工具庫;如果大公司做采集,如果覺(jué)得性?xún)r(jià)比太低,可以考慮使用restful方式,比如headless+websocket+webrtc,nginx+cdn方式,nginx+c++方式,headless+gulp,postgresql+cgi,都是最佳選擇;php+mysql的采集是現在業(yè)余開(kāi)發(fā)中技術(shù)性很強的采集方案,不用引入一些麻煩的包、工具庫或第三方庫;除了laravel以外,目前業(yè)余開(kāi)發(fā)的有nutch+ci;。 查看全部

  采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)
  采集內容管理平臺,國內領(lǐng)先的pc+app采集服務(wù)平臺云采。這是在網(wǎng)絡(luò )信息大爆炸,注意力捉摸不透的今天,利用互聯(lián)網(wǎng)的云技術(shù),結合移動(dòng)端,輕松采集信息。
  這一段時(shí)間在業(yè)余學(xué)習django,簡(jiǎn)單總結一下學(xué)習路線(xiàn)吧:采集主要分為圖片采集、視頻采集、音頻采集,其中圖片采集一般在pc端,也就是坐在電腦前面,通過(guò)瀏覽器查看采集軟件的文件查看,視頻采集一般在手機上,也是用瀏覽器采集,音頻采集很麻煩,是自動(dòng)循環(huán)播放音頻,一般都是直接下載!至于什么樣的軟件,一般百度、阿里都會(huì )有相應的采集軟件,例如圖片采集的推薦url500、音頻采集推薦多采寶app,技術(shù)好的話(huà),你可以去學(xué)習下,都很容易上手!。
  中國采集網(wǎng)。不過(guò)這個(gè)我沒(méi)有用過(guò),
  接著(zhù)樓上的話(huà)題,補充一個(gè):中國采集網(wǎng)推薦原因1,國內數據質(zhì)量相對較高接著(zhù)討論每日站長(cháng)平臺需要的功能,數據質(zhì)量不容小覷。
  業(yè)余開(kāi)發(fā)還是php+mysql+java,php+mysql+redis+drupal比較適合業(yè)余開(kāi)發(fā),這樣不用引入一些費力不討好的框架和工具庫;如果大公司做采集,如果覺(jué)得性?xún)r(jià)比太低,可以考慮使用restful方式,比如headless+websocket+webrtc,nginx+cdn方式,nginx+c++方式,headless+gulp,postgresql+cgi,都是最佳選擇;php+mysql的采集是現在業(yè)余開(kāi)發(fā)中技術(shù)性很強的采集方案,不用引入一些麻煩的包、工具庫或第三方庫;除了laravel以外,目前業(yè)余開(kāi)發(fā)的有nutch+ci;。

采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 134 次瀏覽 ? 2022-01-23 03:00 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)
  采集內容管理平臺是云表格未來(lái)規劃的重點(diǎn),能夠實(shí)現數據采集和表格聚合、流程管理、人事管理、報表分析等多方面的功能,核心業(yè)務(wù)是采集內容和數據有效性,對數據的格式和內容精準的控制是數據分析的關(guān)鍵。其中,數據有效性用于用戶(hù)在數據規范有誤時(shí)提供工具幫助用戶(hù)修正和識別數據,是一種可以靈活部署的功能。市面上一些通用的內容管理產(chǎn)品(如京東、、百度經(jīng)驗)都能實(shí)現上述功能。
  而今天要介紹的優(yōu)圖是優(yōu)圖動(dòng)態(tài)采集內容管理系統,在這個(gè)系統中能夠查看采集的用戶(hù)歷史、信息新增和刪除、已采集信息、待采集數據、已搜索結果、已簽名以及評論等。系統涵蓋了表格和數據庫,對于快速采集信息有不錯的幫助,其目標用戶(hù)就是為了提高工作效率,但問(wèn)題是數據采集時(shí)的準確度是否保證,這將成為用戶(hù)付費的因素之一。
  優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心就是提高數據準確度,同時(shí)隨著(zhù)內容的增加相應的時(shí)間復雜度也會(huì )增加,所以?xún)?yōu)圖在出發(fā)點(diǎn)上就沒(méi)有考慮過(guò)犧牲準確度來(lái)提高收益。以用戶(hù)“中醫小吳先生”為例,根據京東手機通知信息,表格顯示“中醫小吳先生今天20點(diǎn)在某地就診,小吳先生近期曾去該醫院附近的某健康會(huì )所進(jìn)行xxx治療”,這就出現了時(shí)間無(wú)法確定的問(wèn)題,也就是說(shuō)一天之內,不可能有小吳先生的各種關(guān)聯(lián)信息能夠滿(mǎn)足這個(gè)需求。
  如何解決這個(gè)問(wèn)題呢??jì)?yōu)圖的思路就是對信息采集后保存的數據進(jìn)行統計分析,然后推送給用戶(hù)。那么應該怎么做呢?是將數據全部上傳到百度經(jīng)驗中?還是根據圖片確定下來(lái)?還是利用人工智能算法,在后端對信息進(jìn)行搜索呢?“中醫小吳先生”能夠看到京東與京東健康達成的醫療合作,我們無(wú)法得知京東經(jīng)營(yíng)信息,優(yōu)圖能夠想到的就是采集京東商品的信息,因為京東在線(xiàn)上銷(xiāo)售經(jīng)營(yíng)中可以對所有的商品進(jìn)行歸類(lèi),這樣也就從信息數據層面解決了小吳先生無(wú)法統計分析的問(wèn)題。
  其實(shí)用戶(hù)的需求可以從三個(gè)方面解決:一個(gè)是表格中過(guò)多或無(wú)效內容如何清理,一個(gè)是列表中無(wú)法有效分類(lèi),還有一個(gè)是信息數據的準確性。優(yōu)圖動(dòng)態(tài)采集內容管理系統針對上述功能都進(jìn)行了不錯的優(yōu)化,現階段能夠正常使用。歡迎大家關(guān)注優(yōu)圖動(dòng)態(tài)采集內容管理系統,了解更多優(yōu)圖系統更多信息。 查看全部

  采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)
  采集內容管理平臺是云表格未來(lái)規劃的重點(diǎn),能夠實(shí)現數據采集和表格聚合、流程管理、人事管理、報表分析等多方面的功能,核心業(yè)務(wù)是采集內容和數據有效性,對數據的格式和內容精準的控制是數據分析的關(guān)鍵。其中,數據有效性用于用戶(hù)在數據規范有誤時(shí)提供工具幫助用戶(hù)修正和識別數據,是一種可以靈活部署的功能。市面上一些通用的內容管理產(chǎn)品(如京東、、百度經(jīng)驗)都能實(shí)現上述功能。
  而今天要介紹的優(yōu)圖是優(yōu)圖動(dòng)態(tài)采集內容管理系統,在這個(gè)系統中能夠查看采集的用戶(hù)歷史、信息新增和刪除、已采集信息、待采集數據、已搜索結果、已簽名以及評論等。系統涵蓋了表格和數據庫,對于快速采集信息有不錯的幫助,其目標用戶(hù)就是為了提高工作效率,但問(wèn)題是數據采集時(shí)的準確度是否保證,這將成為用戶(hù)付費的因素之一。
  優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心就是提高數據準確度,同時(shí)隨著(zhù)內容的增加相應的時(shí)間復雜度也會(huì )增加,所以?xún)?yōu)圖在出發(fā)點(diǎn)上就沒(méi)有考慮過(guò)犧牲準確度來(lái)提高收益。以用戶(hù)“中醫小吳先生”為例,根據京東手機通知信息,表格顯示“中醫小吳先生今天20點(diǎn)在某地就診,小吳先生近期曾去該醫院附近的某健康會(huì )所進(jìn)行xxx治療”,這就出現了時(shí)間無(wú)法確定的問(wèn)題,也就是說(shuō)一天之內,不可能有小吳先生的各種關(guān)聯(lián)信息能夠滿(mǎn)足這個(gè)需求。
  如何解決這個(gè)問(wèn)題呢??jì)?yōu)圖的思路就是對信息采集后保存的數據進(jìn)行統計分析,然后推送給用戶(hù)。那么應該怎么做呢?是將數據全部上傳到百度經(jīng)驗中?還是根據圖片確定下來(lái)?還是利用人工智能算法,在后端對信息進(jìn)行搜索呢?“中醫小吳先生”能夠看到京東與京東健康達成的醫療合作,我們無(wú)法得知京東經(jīng)營(yíng)信息,優(yōu)圖能夠想到的就是采集京東商品的信息,因為京東在線(xiàn)上銷(xiāo)售經(jīng)營(yíng)中可以對所有的商品進(jìn)行歸類(lèi),這樣也就從信息數據層面解決了小吳先生無(wú)法統計分析的問(wèn)題。
  其實(shí)用戶(hù)的需求可以從三個(gè)方面解決:一個(gè)是表格中過(guò)多或無(wú)效內容如何清理,一個(gè)是列表中無(wú)法有效分類(lèi),還有一個(gè)是信息數據的準確性。優(yōu)圖動(dòng)態(tài)采集內容管理系統針對上述功能都進(jìn)行了不錯的優(yōu)化,現階段能夠正常使用。歡迎大家關(guān)注優(yōu)圖動(dòng)態(tài)采集內容管理系統,了解更多優(yōu)圖系統更多信息。

采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 122 次瀏覽 ? 2022-02-24 22:13 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)
  DMP數據管理平臺(DMP)——在DMP的廣告營(yíng)銷(xiāo)生態(tài)鏈中,SameData處于數據管理平臺的DMP環(huán)節,用于為整個(gè)競價(jià)模式提供實(shí)時(shí)的購買(mǎi)受眾數據。在RTB領(lǐng)域,相比于需求側平臺DSP和供應側平臺SSP,DMP也發(fā)揮著(zhù)重要作用。因為沒(méi)有DMP,所以無(wú)法實(shí)時(shí)判斷目標受眾和單個(gè)受眾的價(jià)格,更談不上實(shí)時(shí)競價(jià)。SameData 利用了一個(gè)巨大的數據庫。通過(guò)川陽(yáng)的ABP受眾購買(mǎi)平臺(DSP平臺),可以在廣告執行前后,以非常直觀(guān)、直觀(guān)的形式,通過(guò)各個(gè)維度向廣告主和代理商展示廣告的全過(guò)程。
  具體來(lái)說(shuō),SameData 在廣告營(yíng)銷(xiāo)生態(tài)鏈中的工作原理和流程如下: 交換平臺或媒體的印象產(chǎn)生后,平臺或媒體通過(guò)標準協(xié)議向 DSP 平臺發(fā)送請求,通常攜帶的信息包括媒體名稱(chēng)。、媒體分類(lèi)、頁(yè)面URL、頁(yè)面上下文關(guān)鍵詞、媒體設定的最低價(jià)格,以及最重要的信息——用戶(hù)cookies。DSP通過(guò)查找預先建立的用戶(hù)映射庫,將用戶(hù)轉化為DSP平臺可以識別的用戶(hù),然后綜合計算從交易平臺或媒體接收到的所有信息,篩選出合適的廣告和最高出價(jià)為廣告,然后放廣告ID,素材地址、跳轉地址、大小、類(lèi)型等回傳給平臺和媒體。中標成功后,平臺會(huì )將中標信息發(fā)送給DSP平臺。實(shí)時(shí)競價(jià)中觀(guān)眾購買(mǎi)涉及的整個(gè)環(huán)境數據需要底層DMP提供。
  因此,由 SameData 驅動(dòng)的 DMP 將不再只關(guān)注實(shí)時(shí)競價(jià)廣告的點(diǎn)擊優(yōu)化,而更多地基于提供企業(yè)受眾細分,進(jìn)一步實(shí)現展示廣告的精準定位和網(wǎng)站優(yōu)化。搜索定位和多次重復定位、受眾研究和數據挖掘 DMP 細分受眾(消費者)并為這些細分受眾購買(mǎi)或出售廣告印象。數據管理平臺將提供更合理、科學(xué)的算法和分析依據,幫助客戶(hù)和媒體高管判斷什么樣的受眾是優(yōu)質(zhì)的,什么樣的廣告平臺有更多這樣的優(yōu)質(zhì)廣告受眾群體,從而得到結果營(yíng)銷(xiāo)推廣的效率更高,效果更好。 查看全部

  采集內容管理平臺(傳漾在傳漾廣告營(yíng)銷(xiāo)生態(tài)鏈中工作原理和流程分析依據)
  DMP數據管理平臺(DMP)——在DMP的廣告營(yíng)銷(xiāo)生態(tài)鏈中,SameData處于數據管理平臺的DMP環(huán)節,用于為整個(gè)競價(jià)模式提供實(shí)時(shí)的購買(mǎi)受眾數據。在RTB領(lǐng)域,相比于需求側平臺DSP和供應側平臺SSP,DMP也發(fā)揮著(zhù)重要作用。因為沒(méi)有DMP,所以無(wú)法實(shí)時(shí)判斷目標受眾和單個(gè)受眾的價(jià)格,更談不上實(shí)時(shí)競價(jià)。SameData 利用了一個(gè)巨大的數據庫。通過(guò)川陽(yáng)的ABP受眾購買(mǎi)平臺(DSP平臺),可以在廣告執行前后,以非常直觀(guān)、直觀(guān)的形式,通過(guò)各個(gè)維度向廣告主和代理商展示廣告的全過(guò)程。
  具體來(lái)說(shuō),SameData 在廣告營(yíng)銷(xiāo)生態(tài)鏈中的工作原理和流程如下: 交換平臺或媒體的印象產(chǎn)生后,平臺或媒體通過(guò)標準協(xié)議向 DSP 平臺發(fā)送請求,通常攜帶的信息包括媒體名稱(chēng)。、媒體分類(lèi)、頁(yè)面URL、頁(yè)面上下文關(guān)鍵詞、媒體設定的最低價(jià)格,以及最重要的信息——用戶(hù)cookies。DSP通過(guò)查找預先建立的用戶(hù)映射庫,將用戶(hù)轉化為DSP平臺可以識別的用戶(hù),然后綜合計算從交易平臺或媒體接收到的所有信息,篩選出合適的廣告和最高出價(jià)為廣告,然后放廣告ID,素材地址、跳轉地址、大小、類(lèi)型等回傳給平臺和媒體。中標成功后,平臺會(huì )將中標信息發(fā)送給DSP平臺。實(shí)時(shí)競價(jià)中觀(guān)眾購買(mǎi)涉及的整個(gè)環(huán)境數據需要底層DMP提供。
  因此,由 SameData 驅動(dòng)的 DMP 將不再只關(guān)注實(shí)時(shí)競價(jià)廣告的點(diǎn)擊優(yōu)化,而更多地基于提供企業(yè)受眾細分,進(jìn)一步實(shí)現展示廣告的精準定位和網(wǎng)站優(yōu)化。搜索定位和多次重復定位、受眾研究和數據挖掘 DMP 細分受眾(消費者)并為這些細分受眾購買(mǎi)或出售廣告印象。數據管理平臺將提供更合理、科學(xué)的算法和分析依據,幫助客戶(hù)和媒體高管判斷什么樣的受眾是優(yōu)質(zhì)的,什么樣的廣告平臺有更多這樣的優(yōu)質(zhì)廣告受眾群體,從而得到結果營(yíng)銷(xiāo)推廣的效率更高,效果更好。

采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 147 次瀏覽 ? 2022-02-24 18:08 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)
  推薦理由:雨小說(shuō)cms是現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架管理軟件,可以很好地為用戶(hù)提供快速建站和網(wǎng)站@采集方法,用戶(hù)可以有效添加網(wǎng)站框架內容包括書(shū)架、評論、搜索、最近閱讀的內容等。新版本更新修復了wap模板和背景分類(lèi)的問(wèn)題,數據結構也類(lèi)似之后相應的優(yōu)化,可以很好的找回聯(lián)盟密碼。運行環(huán)境需要通用服務(wù)器,歡迎有需要的用戶(hù)下載使用。
  野雨小說(shuō)cms簡(jiǎn)介:
  狂語(yǔ)小說(shuō)內容管理系統(以下簡(jiǎn)稱(chēng)KYXScms)的最大特點(diǎn)是靈活、方便、人性化的設計和簡(jiǎn)單易用。有大量小說(shuō)網(wǎng)站的行業(yè),批量采集目標網(wǎng)站數據或使用數據聯(lián)盟自動(dòng)采集獲取大量數據。內置標簽模板,即使是不懂代碼的前端開(kāi)發(fā)者也能快速創(chuàng )作出精美小說(shuō)網(wǎng)站。
  安裝注意事項:
  KYXScms是基于ThinkPHP5.1+MYSQL開(kāi)發(fā)的,可以運行在最常見(jiàn)的服務(wù)器上。
  如windows服務(wù)器、IIS+PHP+MYSQL、
  Linux服務(wù)器,Apache/Nginx+PHP+MYSQL
  強烈建議使用 Linux 服務(wù)器以獲得更大的性能優(yōu)勢
  軟件方面,PHP需要5.6版本以上,5.6版本以下無(wú)法運行。
  硬件方面,一般配置虛擬主機就可以正常運行系統,如果有服務(wù)器就更好了。
  安裝步驟:
  1.解壓文件并上傳到對應目錄等
  2.網(wǎng)站必須配置偽靜態(tài)才能正常安裝使用(第一次訪(fǎng)問(wèn)首頁(yè)會(huì )自動(dòng)進(jìn)入安裝頁(yè)面,或者手動(dòng)輸入域名.com/install)
  3.同意使用協(xié)議進(jìn)入下一步檢查目錄權限
  4.測試通過(guò)后,填寫(xiě)常規數據庫配置項,填寫(xiě)正確,安裝成功。安裝成功后會(huì )自動(dòng)進(jìn)入后臺頁(yè)面域名.com/admin,填寫(xiě)安裝時(shí)輸入的后臺管理員和密碼登錄
  軟件特點(diǎn):
  1.網(wǎng)站采集可以采集任何小說(shuō)網(wǎng)站的功能
  2.數據聯(lián)盟,即使沒(méi)有設置采集的功能,也可以獲得大量新奇數據
  3、前端模板自適應(PC、手機、平板自動(dòng)適配)
  4、搜索關(guān)聯(lián)
  5、書(shū)架功能 查看全部

  采集內容管理平臺(現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架內容管理系統推薦理由)
  推薦理由:雨小說(shuō)cms是現代小說(shuō)網(wǎng)站必選的網(wǎng)站內容框架管理軟件,可以很好地為用戶(hù)提供快速建站和網(wǎng)站@采集方法,用戶(hù)可以有效添加網(wǎng)站框架內容包括書(shū)架、評論、搜索、最近閱讀的內容等。新版本更新修復了wap模板和背景分類(lèi)的問(wèn)題,數據結構也類(lèi)似之后相應的優(yōu)化,可以很好的找回聯(lián)盟密碼。運行環(huán)境需要通用服務(wù)器,歡迎有需要的用戶(hù)下載使用。
  野雨小說(shuō)cms簡(jiǎn)介:
  狂語(yǔ)小說(shuō)內容管理系統(以下簡(jiǎn)稱(chēng)KYXScms)的最大特點(diǎn)是靈活、方便、人性化的設計和簡(jiǎn)單易用。有大量小說(shuō)網(wǎng)站的行業(yè),批量采集目標網(wǎng)站數據或使用數據聯(lián)盟自動(dòng)采集獲取大量數據。內置標簽模板,即使是不懂代碼的前端開(kāi)發(fā)者也能快速創(chuàng )作出精美小說(shuō)網(wǎng)站。
  安裝注意事項:
  KYXScms是基于ThinkPHP5.1+MYSQL開(kāi)發(fā)的,可以運行在最常見(jiàn)的服務(wù)器上。
  如windows服務(wù)器、IIS+PHP+MYSQL、
  Linux服務(wù)器,Apache/Nginx+PHP+MYSQL
  強烈建議使用 Linux 服務(wù)器以獲得更大的性能優(yōu)勢
  軟件方面,PHP需要5.6版本以上,5.6版本以下無(wú)法運行。
  硬件方面,一般配置虛擬主機就可以正常運行系統,如果有服務(wù)器就更好了。
  安裝步驟:
  1.解壓文件并上傳到對應目錄等
  2.網(wǎng)站必須配置偽靜態(tài)才能正常安裝使用(第一次訪(fǎng)問(wèn)首頁(yè)會(huì )自動(dòng)進(jìn)入安裝頁(yè)面,或者手動(dòng)輸入域名.com/install)
  3.同意使用協(xié)議進(jìn)入下一步檢查目錄權限
  4.測試通過(guò)后,填寫(xiě)常規數據庫配置項,填寫(xiě)正確,安裝成功。安裝成功后會(huì )自動(dòng)進(jìn)入后臺頁(yè)面域名.com/admin,填寫(xiě)安裝時(shí)輸入的后臺管理員和密碼登錄
  軟件特點(diǎn):
  1.網(wǎng)站采集可以采集任何小說(shuō)網(wǎng)站的功能
  2.數據聯(lián)盟,即使沒(méi)有設置采集的功能,也可以獲得大量新奇數據
  3、前端模板自適應(PC、手機、平板自動(dòng)適配)
  4、搜索關(guān)聯(lián)
  5、書(shū)架功能

采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 107 次瀏覽 ? 2022-02-20 14:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)
  采集內容管理平臺是做什么的,參考百度百科:內容管理平臺,簡(jiǎn)單的說(shuō),就是幫助企業(yè)進(jìn)行內容的管理的,一般可分為內容采集和內容管理,以及內容的分發(fā)和呈現,這些內容平臺通過(guò)前端的采集系統和審核系統對文章的數據進(jìn)行加工處理,形成采集結果數據,給予后端的存儲、分發(fā)和呈現方面的更為詳細的指導。下面會(huì )以免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集?。
  1、文本采集:對文本進(jìn)行采集的技術(shù)主要是html5sequenceextension。其主要特點(diǎn)是簡(jiǎn)單快捷易用,成本低廉,速度快,數據準確。
  2、圖片采集:通過(guò)圖片的分享來(lái)進(jìn)行文字的采集。比如在微信、qq等私人空間可以發(fā)送圖片鏈接(帶有廣告信息的還需要進(jìn)行審核),將圖片分享到微信、qq等平臺,微信等平臺打開(kāi)圖片鏈接獲取文字之后,按規則輸入內容,然后生成文本。
  3、視頻采集:通過(guò)自動(dòng)生成的flv視頻鏈接,對視頻中的文字進(jìn)行采集,現在視頻網(wǎng)站都有視頻標題搜索功能,這個(gè)技術(shù)也可以用于搜索引擎爬蟲(chóng)。
  4、音頻采集:音頻采集現在很多人都需要抓取音頻資源,無(wú)論是網(wǎng)絡(luò )音頻還是現實(shí)中的語(yǔ)音。
  5、視頻錄制:音頻的采集比較簡(jiǎn)單,采集主要是將音頻進(jìn)行采集,然后匹配數據庫,生成數據庫的文本信息。
  6、音頻格式轉換:音頻格式的轉換主要分為音頻格式轉換的編碼格式和傳輸協(xié)議等,現在主要是4.0gpt格式和utf-8編碼,數據格式包括.mp3,.flac,.m4v等。
  哪些內容可放采集結果?
  1、文字:有時(shí)候一篇文章中需要大量的文字鏈接,需要對每一段文字進(jìn)行采集,編碼方式自定義,utf-8即可。
  2、音頻:將音頻數據采集,編碼方式自定義,utf-8即可。
  3、圖片:通過(guò)采集文章的鏈接,利用http的url重定向(或直接rewrite)獲取。
  4、視頻:通過(guò)采集鏈接,傳輸到后端,傳輸協(xié)議自定義,utf-8即可。
  哪些內容可提取內容?
  1、文本提?。河胾rl對文本進(jìn)行抓取,對內容進(jìn)行匹配,提取出關(guān)鍵詞,點(diǎn)擊內容即可。
  2、圖片提?。篴、對圖片進(jìn)行采集,編碼方式自定義,utf-8即可。b、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。c、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。
  3、文件名提?。禾崛∥募械年P(guān)鍵詞。
  提取關(guān)鍵詞的方法有:
  1、從word中提??;
  2、從excel中提取。
  4、一句話(huà)提?。和ㄟ^(guò)提取文字和關(guān)鍵詞,匹配excel或者是文件名中的關(guān)鍵詞。
  提取文字方法有:
  5、關(guān)鍵詞密度提?。阂崛∧酬P(guān)鍵詞時(shí),分析該關(guān)鍵詞的關(guān)注人數,然后統計該關(guān)鍵詞的人數, 查看全部

  采集內容管理平臺(免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集)
  采集內容管理平臺是做什么的,參考百度百科:內容管理平臺,簡(jiǎn)單的說(shuō),就是幫助企業(yè)進(jìn)行內容的管理的,一般可分為內容采集和內容管理,以及內容的分發(fā)和呈現,這些內容平臺通過(guò)前端的采集系統和審核系統對文章的數據進(jìn)行加工處理,形成采集結果數據,給予后端的存儲、分發(fā)和呈現方面的更為詳細的指導。下面會(huì )以免費api接口做一個(gè)簡(jiǎn)單的介紹:哪些內容可采集?。
  1、文本采集:對文本進(jìn)行采集的技術(shù)主要是html5sequenceextension。其主要特點(diǎn)是簡(jiǎn)單快捷易用,成本低廉,速度快,數據準確。
  2、圖片采集:通過(guò)圖片的分享來(lái)進(jìn)行文字的采集。比如在微信、qq等私人空間可以發(fā)送圖片鏈接(帶有廣告信息的還需要進(jìn)行審核),將圖片分享到微信、qq等平臺,微信等平臺打開(kāi)圖片鏈接獲取文字之后,按規則輸入內容,然后生成文本。
  3、視頻采集:通過(guò)自動(dòng)生成的flv視頻鏈接,對視頻中的文字進(jìn)行采集,現在視頻網(wǎng)站都有視頻標題搜索功能,這個(gè)技術(shù)也可以用于搜索引擎爬蟲(chóng)。
  4、音頻采集:音頻采集現在很多人都需要抓取音頻資源,無(wú)論是網(wǎng)絡(luò )音頻還是現實(shí)中的語(yǔ)音。
  5、視頻錄制:音頻的采集比較簡(jiǎn)單,采集主要是將音頻進(jìn)行采集,然后匹配數據庫,生成數據庫的文本信息。
  6、音頻格式轉換:音頻格式的轉換主要分為音頻格式轉換的編碼格式和傳輸協(xié)議等,現在主要是4.0gpt格式和utf-8編碼,數據格式包括.mp3,.flac,.m4v等。
  哪些內容可放采集結果?
  1、文字:有時(shí)候一篇文章中需要大量的文字鏈接,需要對每一段文字進(jìn)行采集,編碼方式自定義,utf-8即可。
  2、音頻:將音頻數據采集,編碼方式自定義,utf-8即可。
  3、圖片:通過(guò)采集文章的鏈接,利用http的url重定向(或直接rewrite)獲取。
  4、視頻:通過(guò)采集鏈接,傳輸到后端,傳輸協(xié)議自定義,utf-8即可。
  哪些內容可提取內容?
  1、文本提?。河胾rl對文本進(jìn)行抓取,對內容進(jìn)行匹配,提取出關(guān)鍵詞,點(diǎn)擊內容即可。
  2、圖片提?。篴、對圖片進(jìn)行采集,編碼方式自定義,utf-8即可。b、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。c、對圖片進(jìn)行抓取,編碼方式自定義,utf-8即可。
  3、文件名提?。禾崛∥募械年P(guān)鍵詞。
  提取關(guān)鍵詞的方法有:
  1、從word中提??;
  2、從excel中提取。
  4、一句話(huà)提?。和ㄟ^(guò)提取文字和關(guān)鍵詞,匹配excel或者是文件名中的關(guān)鍵詞。
  提取文字方法有:
  5、關(guān)鍵詞密度提?。阂崛∧酬P(guān)鍵詞時(shí),分析該關(guān)鍵詞的關(guān)注人數,然后統計該關(guān)鍵詞的人數,

采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 133 次瀏覽 ? 2022-02-18 07:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)
  KesioncmsKesion內容管理系統是一個(gè)功能強大且應用廣泛的ASP管理系統。由科訊cms開(kāi)發(fā),具有強大、穩定、安全、靈活、易用等優(yōu)點(diǎn)。采用人性化的管理功能,擴展性強,負載能力好,模板調用靈活,可為用戶(hù)提供強大的管理服務(wù)功能。
  
  [基本介紹] Kesioncms作為國內最先進(jìn)的ASP管理系統,自誕生以來(lái)已經(jīng)通過(guò)了5年的運行考驗。它一直受到廣大用戶(hù)的青睞,以其自身的優(yōu)勢,穩定性、安全性、靈活性、易用性等諸多優(yōu)勢。在廣大用戶(hù)的大力支持下,Kesioncms V6版在cms的世界里有了更多的創(chuàng )新和突破。它不負眾望,追求卓越。這是一套專(zhuān)業(yè)開(kāi)放的網(wǎng)站管理系統,通過(guò)她讓建站更簡(jiǎn)單,你再也不用為建站發(fā)愁了,凱信cms人性化的操作模式,強大的后臺管理功能,非常便捷的管理模式,可根據您的需要進(jìn)行定制。定義風(fēng)格的萬(wàn)能標簽,讓非專(zhuān)業(yè)人士也能專(zhuān)業(yè),專(zhuān)業(yè)管理網(wǎng)站為您節省時(shí)間,提高工作效率;系統沒(méi)有任何文件加密,完全開(kāi)源的程序具有無(wú)限的擴展性和可擴展性,靈活的系統二次開(kāi)發(fā)結構可以快速集成第三方軟件,系統徹底解決企業(yè)用戶(hù)的后顧之憂(yōu)-友好的管理界面、操作方式和豐富的功能特點(diǎn)。
  我們相信“簡(jiǎn)單就是美”,因此,科訊的開(kāi)發(fā)者在開(kāi)發(fā)過(guò)程中始終充分考慮用戶(hù)的使用習慣,盡量降低用戶(hù)的使用門(mén)檻,讓用戶(hù)可以專(zhuān)注于內容維護本身,無(wú)需投入過(guò)多時(shí)間學(xué)習如何使用系統,注意細節。
  作為中國最大的網(wǎng)站管理系統軟件和服務(wù)提供商,我們的開(kāi)發(fā)團隊擁有豐富的Web應用設計經(jīng)驗,尤其是在管理系統產(chǎn)品及相關(guān)領(lǐng)域。經(jīng)過(guò)長(cháng)期的創(chuàng )新發(fā)展,我們掌握了一整套從算法、數據結構到產(chǎn)品安全的領(lǐng)先技術(shù)。這使得凱勝cms在易用性、穩定性、承載能力、安全保障等方面處于國內外同類(lèi)產(chǎn)品的領(lǐng)先地位。
  [軟件特點(diǎn)] ☆。系統采用模塊化開(kāi)發(fā),100%開(kāi)源,擴展性更強,二次開(kāi)發(fā)更方便。
  系統模型管理,可以暫時(shí)屏蔽不需要的功能模型,需要時(shí)再打開(kāi)。
  ☆、支持無(wú)限列,可綁定二級域名,加載速度更快
  可以分批添加色譜柱以提高效率并節省時(shí)間??梢酝ㄟ^(guò)一鍵對列進(jìn)行排序來(lái)改變列的生成順序
  ☆。系統支持3種生成方式,全站生成HTML靜態(tài)和動(dòng)態(tài)ASP和偽靜態(tài)
<p>整個(gè)系統可以生成靜態(tài)HTML,有效的提高了系統的性能,不僅減輕了服務(wù)器的負載,提高了收錄的搜索率,還提高了網(wǎng)站 查看全部

  采集內容管理平臺(KesionCMS下,KesionCMSV6版本的CMS界有了更多的創(chuàng )新與突破)
  KesioncmsKesion內容管理系統是一個(gè)功能強大且應用廣泛的ASP管理系統。由科訊cms開(kāi)發(fā),具有強大、穩定、安全、靈活、易用等優(yōu)點(diǎn)。采用人性化的管理功能,擴展性強,負載能力好,模板調用靈活,可為用戶(hù)提供強大的管理服務(wù)功能。
  
  [基本介紹] Kesioncms作為國內最先進(jìn)的ASP管理系統,自誕生以來(lái)已經(jīng)通過(guò)了5年的運行考驗。它一直受到廣大用戶(hù)的青睞,以其自身的優(yōu)勢,穩定性、安全性、靈活性、易用性等諸多優(yōu)勢。在廣大用戶(hù)的大力支持下,Kesioncms V6版在cms的世界里有了更多的創(chuàng )新和突破。它不負眾望,追求卓越。這是一套專(zhuān)業(yè)開(kāi)放的網(wǎng)站管理系統,通過(guò)她讓建站更簡(jiǎn)單,你再也不用為建站發(fā)愁了,凱信cms人性化的操作模式,強大的后臺管理功能,非常便捷的管理模式,可根據您的需要進(jìn)行定制。定義風(fēng)格的萬(wàn)能標簽,讓非專(zhuān)業(yè)人士也能專(zhuān)業(yè),專(zhuān)業(yè)管理網(wǎng)站為您節省時(shí)間,提高工作效率;系統沒(méi)有任何文件加密,完全開(kāi)源的程序具有無(wú)限的擴展性和可擴展性,靈活的系統二次開(kāi)發(fā)結構可以快速集成第三方軟件,系統徹底解決企業(yè)用戶(hù)的后顧之憂(yōu)-友好的管理界面、操作方式和豐富的功能特點(diǎn)。
  我們相信“簡(jiǎn)單就是美”,因此,科訊的開(kāi)發(fā)者在開(kāi)發(fā)過(guò)程中始終充分考慮用戶(hù)的使用習慣,盡量降低用戶(hù)的使用門(mén)檻,讓用戶(hù)可以專(zhuān)注于內容維護本身,無(wú)需投入過(guò)多時(shí)間學(xué)習如何使用系統,注意細節。
  作為中國最大的網(wǎng)站管理系統軟件和服務(wù)提供商,我們的開(kāi)發(fā)團隊擁有豐富的Web應用設計經(jīng)驗,尤其是在管理系統產(chǎn)品及相關(guān)領(lǐng)域。經(jīng)過(guò)長(cháng)期的創(chuàng )新發(fā)展,我們掌握了一整套從算法、數據結構到產(chǎn)品安全的領(lǐng)先技術(shù)。這使得凱勝cms在易用性、穩定性、承載能力、安全保障等方面處于國內外同類(lèi)產(chǎn)品的領(lǐng)先地位。
  [軟件特點(diǎn)] ☆。系統采用模塊化開(kāi)發(fā),100%開(kāi)源,擴展性更強,二次開(kāi)發(fā)更方便。
  系統模型管理,可以暫時(shí)屏蔽不需要的功能模型,需要時(shí)再打開(kāi)。
  ☆、支持無(wú)限列,可綁定二級域名,加載速度更快
  可以分批添加色譜柱以提高效率并節省時(shí)間??梢酝ㄟ^(guò)一鍵對列進(jìn)行排序來(lái)改變列的生成順序
  ☆。系統支持3種生成方式,全站生成HTML靜態(tài)和動(dòng)態(tài)ASP和偽靜態(tài)
<p>整個(gè)系統可以生成靜態(tài)HTML,有效的提高了系統的性能,不僅減輕了服務(wù)器的負載,提高了收錄的搜索率,還提高了網(wǎng)站

采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 112 次瀏覽 ? 2022-02-16 15:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)
  采集內容管理平臺
  你一直問(wèn)中介方利益相關(guān)的問(wèn)題嗎?我覺(jué)得你們不談價(jià)格,談?wù)劮?wù)模式是比較合理的。另外,我覺(jué)得中介應該有責任告訴客戶(hù),資金凍結的依據、怎么解凍、解凍后再往外推錢(qián)該怎么辦?如果發(fā)生糾紛,怎么解決,
  目前正在從事國內房產(chǎn)中介服務(wù)行業(yè),我簡(jiǎn)單的闡述我的認識和理解。作為一個(gè)經(jīng)紀人你就需要明確,你將要賣(mài)房的房產(chǎn)優(yōu)缺點(diǎn)以及價(jià)格要求,并且需要用合適的方式去解決。作為一個(gè)資深的房產(chǎn)經(jīng)紀人,還應該有一個(gè)基本價(jià)值觀(guān),就是說(shuō)不是你想給中介多少錢(qián),中介就需要給你多少錢(qián),或者,你直接找中介的房源,中介會(huì )給你安排多少錢(qián)的房源。他要考慮合理的推薦的房源以及適當的對接房東,畢竟賣(mài)房的才是大爺。
  資金池問(wèn)題
  目前進(jìn)入市場(chǎng)的中介全是信息混亂的,如果你的房子有價(jià)格和信息優(yōu)勢,可以相互結對子找別的中介做朋友,資金池應該是規避不了的,不過(guò)你說(shuō)的找個(gè)安全可靠的,太多人做了,最終估計就是數量就過(guò)濾了,換一家就是了,對你來(lái)說(shuō),找到一個(gè)有合適資金安全的平臺,
  房產(chǎn)中介應該有合理的成本結構,依我來(lái)看,任何推薦、融資都會(huì )有一定的風(fēng)險,就像新加坡globallendingpartners披露的手續費是個(gè)極為大的坑,大部分中介會(huì )主動(dòng)選擇把費用降低到每次交易0.5%-1%,個(gè)別甚至不到每月5%.如果某中介真誠推薦,最多能給你這么少費用,但是如果這中介收高于其他顧問(wèn)的費用,我個(gè)人認為他是能力問(wèn)題或者以后怎么做做好本職工作的問(wèn)題。 查看全部

  采集內容管理平臺(資深房產(chǎn)經(jīng)紀人如何解決中介方利益相關(guān)的問(wèn)題?)
  采集內容管理平臺
  你一直問(wèn)中介方利益相關(guān)的問(wèn)題嗎?我覺(jué)得你們不談價(jià)格,談?wù)劮?wù)模式是比較合理的。另外,我覺(jué)得中介應該有責任告訴客戶(hù),資金凍結的依據、怎么解凍、解凍后再往外推錢(qián)該怎么辦?如果發(fā)生糾紛,怎么解決,
  目前正在從事國內房產(chǎn)中介服務(wù)行業(yè),我簡(jiǎn)單的闡述我的認識和理解。作為一個(gè)經(jīng)紀人你就需要明確,你將要賣(mài)房的房產(chǎn)優(yōu)缺點(diǎn)以及價(jià)格要求,并且需要用合適的方式去解決。作為一個(gè)資深的房產(chǎn)經(jīng)紀人,還應該有一個(gè)基本價(jià)值觀(guān),就是說(shuō)不是你想給中介多少錢(qián),中介就需要給你多少錢(qián),或者,你直接找中介的房源,中介會(huì )給你安排多少錢(qián)的房源。他要考慮合理的推薦的房源以及適當的對接房東,畢竟賣(mài)房的才是大爺。
  資金池問(wèn)題
  目前進(jìn)入市場(chǎng)的中介全是信息混亂的,如果你的房子有價(jià)格和信息優(yōu)勢,可以相互結對子找別的中介做朋友,資金池應該是規避不了的,不過(guò)你說(shuō)的找個(gè)安全可靠的,太多人做了,最終估計就是數量就過(guò)濾了,換一家就是了,對你來(lái)說(shuō),找到一個(gè)有合適資金安全的平臺,
  房產(chǎn)中介應該有合理的成本結構,依我來(lái)看,任何推薦、融資都會(huì )有一定的風(fēng)險,就像新加坡globallendingpartners披露的手續費是個(gè)極為大的坑,大部分中介會(huì )主動(dòng)選擇把費用降低到每次交易0.5%-1%,個(gè)別甚至不到每月5%.如果某中介真誠推薦,最多能給你這么少費用,但是如果這中介收高于其他顧問(wèn)的費用,我個(gè)人認為他是能力問(wèn)題或者以后怎么做做好本職工作的問(wèn)題。

采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 155 次瀏覽 ? 2022-02-16 05:04 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)
  信息模板.doc(133.5 K)
  我們公司需要做一個(gè)“數據采集管理系統”。就是從一些公開(kāi)的網(wǎng)站信息中采集、整理數據,然后按照規定的格式將文本輸入到系統中,以便系統進(jìn)行事后統計、分析、整理和分類(lèi)。
  一、系統的組成結構為:WEB瀏覽器客戶(hù)端,由表示層、業(yè)務(wù)層、數據層等組成的中間層,以及數據庫服務(wù)器。
  二、系統的功能有:
  1、系統管理
  包括系統運行前必須設置的基本信息和系統用戶(hù)賬號的統一管理?;A信息是整個(gè)系統的基本元數據,是系統完整運行的前提。用戶(hù)賬號與人員信息相關(guān)聯(lián),人員信息是所有使用系統的人員的身份識別信息,用戶(hù)對系統的訪(fǎng)問(wèn)由賬號管理控制。
  具體內容包括:組織管理、員工管理、權限管理、操作賬號管理、操作日志管理
  2、數據采集管理
  管理數據分類(lèi)設置,組織輸入數據并提供基本查詢(xún)功能。
  3、數據查詢(xún)管理
  根據數據的各個(gè)關(guān)鍵字段,查詢(xún)復雜的組合條件。
  4、數據統計管理
  按條件統計采集數據的相關(guān)指標。
  三、要求:
  1、系統基于INTERNET標準協(xié)議,可在廣域網(wǎng)條件下工作。
  2、系統采用企業(yè)級應用服務(wù)器平臺,可實(shí)現多服務(wù)器負載均衡、多數據庫連接等擴展,保證數據處理能力的擴展。
  3、系統采用完整的BS結構,維護工作全部在服務(wù)器端進(jìn)行,沒(méi)有客戶(hù)端調試、維護等工作。大大減輕系統管理員的工作量。
  4、系統各項操作功能風(fēng)格一致,形象直觀(guān),簡(jiǎn)單易懂,一般用戶(hù)使用方便。
  5、當數據被輸入、修改或刪除時(shí),系統會(huì )自動(dòng)檢查和處理相關(guān)數據,并提示用戶(hù)提供相關(guān)信息,以保證數據的完整性和一致性。
  6、系統架構應該能夠保證數據庫的安全,避免信息被不當刪除。
  具體信息模板見(jiàn)附件。
  親愛(ài)的同學(xué)們,如果您有興趣并且能夠完成這項工作,您可以給我報價(jià)(在網(wǎng)站上短我)。有經(jīng)驗者優(yōu)先。謝謝! 查看全部

  采集內容管理平臺(公開(kāi)網(wǎng)站信息收集整理資料后按照規定的格式將文字錄入系統)
  信息模板.doc(133.5 K)
  我們公司需要做一個(gè)“數據采集管理系統”。就是從一些公開(kāi)的網(wǎng)站信息中采集、整理數據,然后按照規定的格式將文本輸入到系統中,以便系統進(jìn)行事后統計、分析、整理和分類(lèi)。
  一、系統的組成結構為:WEB瀏覽器客戶(hù)端,由表示層、業(yè)務(wù)層、數據層等組成的中間層,以及數據庫服務(wù)器。
  二、系統的功能有:
  1、系統管理
  包括系統運行前必須設置的基本信息和系統用戶(hù)賬號的統一管理?;A信息是整個(gè)系統的基本元數據,是系統完整運行的前提。用戶(hù)賬號與人員信息相關(guān)聯(lián),人員信息是所有使用系統的人員的身份識別信息,用戶(hù)對系統的訪(fǎng)問(wèn)由賬號管理控制。
  具體內容包括:組織管理、員工管理、權限管理、操作賬號管理、操作日志管理
  2、數據采集管理
  管理數據分類(lèi)設置,組織輸入數據并提供基本查詢(xún)功能。
  3、數據查詢(xún)管理
  根據數據的各個(gè)關(guān)鍵字段,查詢(xún)復雜的組合條件。
  4、數據統計管理
  按條件統計采集數據的相關(guān)指標。
  三、要求:
  1、系統基于INTERNET標準協(xié)議,可在廣域網(wǎng)條件下工作。
  2、系統采用企業(yè)級應用服務(wù)器平臺,可實(shí)現多服務(wù)器負載均衡、多數據庫連接等擴展,保證數據處理能力的擴展。
  3、系統采用完整的BS結構,維護工作全部在服務(wù)器端進(jìn)行,沒(méi)有客戶(hù)端調試、維護等工作。大大減輕系統管理員的工作量。
  4、系統各項操作功能風(fēng)格一致,形象直觀(guān),簡(jiǎn)單易懂,一般用戶(hù)使用方便。
  5、當數據被輸入、修改或刪除時(shí),系統會(huì )自動(dòng)檢查和處理相關(guān)數據,并提示用戶(hù)提供相關(guān)信息,以保證數據的完整性和一致性。
  6、系統架構應該能夠保證數據庫的安全,避免信息被不當刪除。
  具體信息模板見(jiàn)附件。
  親愛(ài)的同學(xué)們,如果您有興趣并且能夠完成這項工作,您可以給我報價(jià)(在網(wǎng)站上短我)。有經(jīng)驗者優(yōu)先。謝謝!

采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 117 次瀏覽 ? 2022-02-15 19:05 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)
  采集內容管理平臺包括兩部分:采集數據服務(wù)商(如百度,esp等)與采集人員。我知道怎么操作,但以我已有的專(zhuān)業(yè)知識,我猜測您說(shuō)的這種采集平臺,應該只能采集公開(kāi)免費的資源,因為采集這些外鏈,或內容管理平臺就是做社交化推廣(也是做網(wǎng)站推廣),如果采集的是正式或灰色內容,
  你可以學(xué)學(xué)麥客在線(xiàn),采集進(jìn)來(lái)的內容操作都是用麥客在線(xiàn)的,
  麥客是常用工具中的一種,采集的時(shí)候需要針對內容有所選擇,僅需要采集發(fā)表過(guò)的內容即可。
  采集引擎可能知道采集哪個(gè)頁(yè)面,
  百度、搜狗、360、谷歌就算了??纯幢镜氐膁sp內容管理平臺吧。不過(guò)最近回答這類(lèi)問(wèn)題比較多,更推薦自己用的內容管理平臺-中搜內容管理平臺不僅可以采集也可以實(shí)現文章自動(dòng)分類(lèi)整理、文章的更新計劃,實(shí)現電子郵件的自動(dòng)發(fā)送,用戶(hù)群的自動(dòng)定位,過(guò)程管理等多重功能。
  百度蜘蛛挖了半天就得到一個(gè)頁(yè)面,
  現在的采集平臺的數據抓取部分有備份的,你得想辦法切掉源代碼。
  采集時(shí)可能會(huì )留下某些鏈接,不存在絕對的安全可靠,這個(gè)還是看采集平臺的策略。我目前知道的有麥客、鳥(niǎo)采。
  原來(lái)市面上有三個(gè)內容采集工具,采集效率,技術(shù)成熟度都不是很好,很容易爬很多頁(yè)面,這也是三個(gè)內容抓取工具的用戶(hù)群的原因。鳥(niǎo)采自動(dòng)采集,免費版就能采到99%的網(wǎng)站,價(jià)格也不貴,但平均下來(lái)每天要50元錢(qián),好像不能登錄/發(fā)送郵件。eoson全自動(dòng)采集,可以采到99%以上的網(wǎng)站,貴一點(diǎn)但能上網(wǎng)站首頁(yè),便宜又操作簡(jiǎn)單。
  百度云內容采集,可以說(shuō)是良心中的良心,免費,無(wú)廣告,一鍵登錄/發(fā)送郵件就好。很多網(wǎng)站的內容都能很方便的采集到。 查看全部

  采集內容管理平臺(dsp內容管理平臺怎么做?采集數據服務(wù)商怎么操作)
  采集內容管理平臺包括兩部分:采集數據服務(wù)商(如百度,esp等)與采集人員。我知道怎么操作,但以我已有的專(zhuān)業(yè)知識,我猜測您說(shuō)的這種采集平臺,應該只能采集公開(kāi)免費的資源,因為采集這些外鏈,或內容管理平臺就是做社交化推廣(也是做網(wǎng)站推廣),如果采集的是正式或灰色內容,
  你可以學(xué)學(xué)麥客在線(xiàn),采集進(jìn)來(lái)的內容操作都是用麥客在線(xiàn)的,
  麥客是常用工具中的一種,采集的時(shí)候需要針對內容有所選擇,僅需要采集發(fā)表過(guò)的內容即可。
  采集引擎可能知道采集哪個(gè)頁(yè)面,
  百度、搜狗、360、谷歌就算了??纯幢镜氐膁sp內容管理平臺吧。不過(guò)最近回答這類(lèi)問(wèn)題比較多,更推薦自己用的內容管理平臺-中搜內容管理平臺不僅可以采集也可以實(shí)現文章自動(dòng)分類(lèi)整理、文章的更新計劃,實(shí)現電子郵件的自動(dòng)發(fā)送,用戶(hù)群的自動(dòng)定位,過(guò)程管理等多重功能。
  百度蜘蛛挖了半天就得到一個(gè)頁(yè)面,
  現在的采集平臺的數據抓取部分有備份的,你得想辦法切掉源代碼。
  采集時(shí)可能會(huì )留下某些鏈接,不存在絕對的安全可靠,這個(gè)還是看采集平臺的策略。我目前知道的有麥客、鳥(niǎo)采。
  原來(lái)市面上有三個(gè)內容采集工具,采集效率,技術(shù)成熟度都不是很好,很容易爬很多頁(yè)面,這也是三個(gè)內容抓取工具的用戶(hù)群的原因。鳥(niǎo)采自動(dòng)采集,免費版就能采到99%的網(wǎng)站,價(jià)格也不貴,但平均下來(lái)每天要50元錢(qián),好像不能登錄/發(fā)送郵件。eoson全自動(dòng)采集,可以采到99%以上的網(wǎng)站,貴一點(diǎn)但能上網(wǎng)站首頁(yè),便宜又操作簡(jiǎn)單。
  百度云內容采集,可以說(shuō)是良心中的良心,免費,無(wú)廣告,一鍵登錄/發(fā)送郵件就好。很多網(wǎng)站的內容都能很方便的采集到。

采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 150 次瀏覽 ? 2022-02-13 02:16 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)
  高職人才培養工作狀態(tài)資料采集及管理平臺V2.16a001操作指南一、總體流程2二、初始設置21.管理員登錄。22.系統設置 33.導入初始數據。3(1)選擇導入方式。4(2)讀入文件。5(3)導入數據。5(4)查看數據。6(5)生成數據中心.64、權限設置.7三、用戶(hù)登錄8四、網(wǎng)絡(luò )布局9五、系統設置(由狀態(tài)數據負責人操作)101.@ &gt;權限設置.102.工作分配.10(1)設置審核人/采集人員.11(2)添加負責人11(3)設置權限. 12 (4)批量設置采集 人員/審閱者。13(5)發(fā)布工作通知。143.工作統計。154.狀態(tài)設置.155.重置密碼.166.查看操作日志.16&lt; @7、數據源匹配檢測178、指標與數據項關(guān)聯(lián)檢測179.數據上報1810、工作統計2011、數據備份2211.1、備份平臺數據庫2211.2、導出標準版本22六、日常管理231、添加數據242、編輯數據263、審核數據27 4.單表導入28一、總體流程二、初始化設置管理員登錄-系統設置-導入初始化數據-權限設置-設置狀態(tài)數據管理員登錄負責人。打開(kāi)登錄頁(yè)面登錄,輸入9999,初始密碼為1。右上角有修改密碼按鈕,可以先修改密碼!登錄系統設置后。
  單擊主頁(yè)上的系統設置。導入初始數據。有四種導入初始數據。首先是導入2015標準版。主要針對首次使用網(wǎng)絡(luò )版的高校,從診改網(wǎng)站下載15年標準版數據并導入。本次導入只能導入15年的靜態(tài)數據,其他每年都變的數據不會(huì )導入。二是導入2016標準版。主要針對已經(jīng)在使用標準版采集的學(xué)校,這種導入方式可以導入2016標準版中的所有數據。三是提取數據。主要針對已經(jīng)在使用CRP系統的高校,無(wú)需人工采集提取各個(gè)系統的數據。第四,復制數據。主要針對去年用過(guò)網(wǎng)絡(luò )版的機構,去年的數據庫還在同一臺服務(wù)器上。抄數據其實(shí)就是抄2015年網(wǎng)絡(luò )版的數據和2015年的工作分布,只是表有很大的變化,比如四類(lèi)教師的教學(xué)情況。(只能復制審核通過(guò)的數據)如果2015網(wǎng)絡(luò )版數據庫中沒(méi)有服務(wù)器,請根據學(xué)校情況選擇第一個(gè)或第二個(gè)選項導入數據。由于導入方式相同,這里以導入2015標準版為例。選擇導入方法。點(diǎn)擊導入2015標準版,因為是第一次導入,所以只有清除數據的選項。單擊完成進(jìn)入下一步。讀入文件。選擇要導入的文件,然后單擊上傳進(jìn)入下一步。導入數據。單擊導入數據按鈕以導入數據。
  檢查數據。單擊檢查數據以檢查數據格式。如果數據有錯誤,請點(diǎn)擊下載錯誤信息,然后根據錯誤信息打開(kāi)標準版,找到錯誤的單元格,進(jìn)行修改。修改后需要重新讀取文件才能導入數據。生成數據中心。點(diǎn)擊 Generate Data 中的按鈕,完成數據導入。4、權限設置。權限設置主要針對學(xué)校領(lǐng)導和一些需要特殊權限的老師。其他 采集 或被審核教師的權限在作業(yè)中設置。管理員設置狀態(tài)數據所有者。點(diǎn)擊添加按鈕,依次勾選權限,點(diǎn)擊保存完成添加(以后權限設置,采集設置的操作 在登錄頁(yè)面輸入正確的卡號和密碼后,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集管理平臺(網(wǎng)絡(luò )版)。四、網(wǎng)絡(luò )版布局當用戶(hù)進(jìn)入狀態(tài)時(shí)data采集平臺(在線(xiàn)版)“狀態(tài)數據目錄”界面。網(wǎng)絡(luò )版平臺的版面設計參考“標準版”的版面方式,分為菜單區和工作內容區,以減少用戶(hù)的不適感。
  工作分配是對整個(gè)數據采集工作的合理安排。分為兩個(gè)階段:數據源表采集及其數據表采集,必須先完成源表的數據采集才能進(jìn)入下一階段。(比如7.1.1個(gè)專(zhuān)業(yè)表不采集好,那么后面會(huì )涉及到專(zhuān)業(yè)表,可能會(huì )出現無(wú)法選擇專(zhuān)業(yè)的情況。)設置審稿人/采集人。點(diǎn)擊管理頁(yè)面工作表記錄行“數據表負責人”欄的“設置”按鈕,打開(kāi)分配新工作負責人管理窗口(2)添加負責人點(diǎn)擊“添加人員負責” 按鈕打開(kāi)分配新負責人的管理窗口??梢詮摹安块T(mén)”下拉框中選擇部門(mén)查找要分配的用戶(hù),也可以直接在“部門(mén)”下拉框中輸入要分配的用戶(hù)的姓名/卡號在“姓名/卡號”輸入框找到它,然后勾選用戶(hù)記錄,點(diǎn)擊“添加”按鈕選擇用戶(hù),然后點(diǎn)擊“保存”按鈕完成分配。如果單擊“刪除負責人”按鈕,當前負責人權限將被刪除。同理,采集表數據負責人的分配方法參考上述說(shuō)明,只需點(diǎn)擊“數據表采集人”欄的“設置”按鈕進(jìn)行設置即可。
  操作步驟與設置reviewer 相同。(4)批量設置采集人員/審批人。點(diǎn)擊批量設置按鈕,依次選擇人員和負責人資料表,點(diǎn)擊保存完成設置。批量刪除功能,操作步驟為類(lèi)似。(5)發(fā)布工作通知。所有工作表都分配好工作計劃后,輸入“工作要求”和“完成時(shí)間”,點(diǎn)擊“發(fā)布工作通知”按鈕,完成發(fā)布工作工作通知。發(fā)布后,采集人登錄系統時(shí)會(huì )自動(dòng)彈出工作任務(wù)提示。注意:“采集其他數據表工作”和“&lt; @采集 數據源表的工作”類(lèi)似。&lt; @3.工作統計。發(fā)布 工作后,您可以在此處查看采集工作的進(jìn)度。4.狀態(tài)設置。該功能可以設置用戶(hù)是否允許采集或更改數據。(1)管理員點(diǎn)擊首頁(yè)“菜單區”的“系統設置”欄,點(diǎn)擊左側菜單“一、系統設置”下的“狀態(tài)設置”選項,打開(kāi)狀態(tài)設置管理頁(yè)面。
  稍后在補充說(shuō)明中說(shuō)明原因,點(diǎn)擊“保存...說(shuō)明”按鈕完成。9.數據上報 數據上報提供給用戶(hù)采集平臺中的狀態(tài)數據上報到教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。
  注意:頁(yè)面打開(kāi)可能需要一段時(shí)間(因為此時(shí)將生成案例研究的摘要數據),請稍候。(2)填寫(xiě)機構代碼、密碼(登錄云中心的密碼)和驗證碼,點(diǎn)擊“登錄”按鈕開(kāi)始進(jìn)入上報數據管理頁(yè)面。(3) “數據生成”將系統生成采集的狀態(tài)數據作為報告數據。選擇“年份”和“學(xué)校名稱(chēng)”后,點(diǎn)擊“生成”按鈕生成數據。(4)@ &gt; “數據上報”是將生成的數據上報到云端的“高職數據中心”,用戶(hù)可以點(diǎn)擊“上報”按鈕完成上報。注意:(1)上報時(shí),系統不應還有 ” 系統會(huì )自動(dòng)將任務(wù)變?yōu)椤斑M(jìn)行中”狀態(tài);當用戶(hù)完成data采集任務(wù)后,需要進(jìn)入該頁(yè)面點(diǎn)擊“操作”欄中的“完成”按鈕完成任務(wù),任務(wù)變?yōu)椤巴瓿伞睜顟B(tài);如果用戶(hù)任務(wù)到期前未完成任務(wù),系統會(huì )自動(dòng)變?yōu)椤拔赐瓿伞睜顟B(tài)。
  右上角按鈕,備份平臺數據庫。11.2、導出標準版說(shuō)明:如果需要將數據導出到標準版,必須先上報數據,然后登錄“中國職業(yè)教育評估”網(wǎng)站,操作在《高職院校人才培養工作狀況數據采集及管理平臺》中。日常管理包括:(1)按“工作分配”劃分,采集我負責的狀態(tài)數據;(2)默認用戶(hù)采集由系統自動(dòng)分配的狀態(tài)數據)系統(如專(zhuān)職教師,默認可以是2)默認用戶(hù)采集@采集6.表1狀態(tài)數據)。(3)數據管理員審核提交的狀態(tài)數據。注意:當用戶(hù)填寫(xiě)不在權限范圍內的狀態(tài)數據時(shí),系統會(huì )自動(dòng)提示告知。第一步:登錄系統。使用瀏覽器訪(fǎng)問(wèn)平臺網(wǎng)站。然后輸入卡號和密碼,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集和管理平臺。第 2 步:管理數據。
  勾選要編輯的記錄后,點(diǎn)擊“編輯”按鈕,打開(kāi)修改管理頁(yè)面。(2)更正相應內容后,點(diǎn)擊“保存”按鈕完成。注意:(1)如果用戶(hù)需要刪除一條記錄,可以先查看該記錄,然后點(diǎn)擊“刪除”按鈕刪除已經(jīng)過(guò)采集的狀態(tài)數據。(2)已經(jīng)審核“通過(guò)”的記錄不允許刪除。3、審核數據(1)勾選需要審核的記錄后,點(diǎn)擊“審核”按鈕,打開(kāi)審核記錄管理窗口。(2)選擇“審核結果”并填寫(xiě)“審核備注”,然后點(diǎn)擊“保存”按鈕完成。4.單一表單導入。(&lt; @1)點(diǎn)擊導入按鈕,進(jìn)入單表導入頁(yè)面。(2)點(diǎn)擊右上角下載導入的模板,將數據填入模板,導入即可。注意:?jiǎn)伪韺肟蛇x擇清空數據導入或添加數據。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清空模式導入只會(huì )清空該表。如果是擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。 查看全部

  采集內容管理平臺(高等職業(yè)院校人才培養工作狀態(tài)數據采集與管理平臺V2.16a001操作指南)
  高職人才培養工作狀態(tài)資料采集及管理平臺V2.16a001操作指南一、總體流程2二、初始設置21.管理員登錄。22.系統設置 33.導入初始數據。3(1)選擇導入方式。4(2)讀入文件。5(3)導入數據。5(4)查看數據。6(5)生成數據中心.64、權限設置.7三、用戶(hù)登錄8四、網(wǎng)絡(luò )布局9五、系統設置(由狀態(tài)數據負責人操作)101.@ &gt;權限設置.102.工作分配.10(1)設置審核人/采集人員.11(2)添加負責人11(3)設置權限. 12 (4)批量設置采集 人員/審閱者。13(5)發(fā)布工作通知。143.工作統計。154.狀態(tài)設置.155.重置密碼.166.查看操作日志.16&lt; @7、數據源匹配檢測178、指標與數據項關(guān)聯(lián)檢測179.數據上報1810、工作統計2011、數據備份2211.1、備份平臺數據庫2211.2、導出標準版本22六、日常管理231、添加數據242、編輯數據263、審核數據27 4.單表導入28一、總體流程二、初始化設置管理員登錄-系統設置-導入初始化數據-權限設置-設置狀態(tài)數據管理員登錄負責人。打開(kāi)登錄頁(yè)面登錄,輸入9999,初始密碼為1。右上角有修改密碼按鈕,可以先修改密碼!登錄系統設置后。
  單擊主頁(yè)上的系統設置。導入初始數據。有四種導入初始數據。首先是導入2015標準版。主要針對首次使用網(wǎng)絡(luò )版的高校,從診改網(wǎng)站下載15年標準版數據并導入。本次導入只能導入15年的靜態(tài)數據,其他每年都變的數據不會(huì )導入。二是導入2016標準版。主要針對已經(jīng)在使用標準版采集的學(xué)校,這種導入方式可以導入2016標準版中的所有數據。三是提取數據。主要針對已經(jīng)在使用CRP系統的高校,無(wú)需人工采集提取各個(gè)系統的數據。第四,復制數據。主要針對去年用過(guò)網(wǎng)絡(luò )版的機構,去年的數據庫還在同一臺服務(wù)器上。抄數據其實(shí)就是抄2015年網(wǎng)絡(luò )版的數據和2015年的工作分布,只是表有很大的變化,比如四類(lèi)教師的教學(xué)情況。(只能復制審核通過(guò)的數據)如果2015網(wǎng)絡(luò )版數據庫中沒(méi)有服務(wù)器,請根據學(xué)校情況選擇第一個(gè)或第二個(gè)選項導入數據。由于導入方式相同,這里以導入2015標準版為例。選擇導入方法。點(diǎn)擊導入2015標準版,因為是第一次導入,所以只有清除數據的選項。單擊完成進(jìn)入下一步。讀入文件。選擇要導入的文件,然后單擊上傳進(jìn)入下一步。導入數據。單擊導入數據按鈕以導入數據。
  檢查數據。單擊檢查數據以檢查數據格式。如果數據有錯誤,請點(diǎn)擊下載錯誤信息,然后根據錯誤信息打開(kāi)標準版,找到錯誤的單元格,進(jìn)行修改。修改后需要重新讀取文件才能導入數據。生成數據中心。點(diǎn)擊 Generate Data 中的按鈕,完成數據導入。4、權限設置。權限設置主要針對學(xué)校領(lǐng)導和一些需要特殊權限的老師。其他 采集 或被審核教師的權限在作業(yè)中設置。管理員設置狀態(tài)數據所有者。點(diǎn)擊添加按鈕,依次勾選權限,點(diǎn)擊保存完成添加(以后權限設置,采集設置的操作 在登錄頁(yè)面輸入正確的卡號和密碼后,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集管理平臺(網(wǎng)絡(luò )版)。四、網(wǎng)絡(luò )版布局當用戶(hù)進(jìn)入狀態(tài)時(shí)data采集平臺(在線(xiàn)版)“狀態(tài)數據目錄”界面。網(wǎng)絡(luò )版平臺的版面設計參考“標準版”的版面方式,分為菜單區和工作內容區,以減少用戶(hù)的不適感。
  工作分配是對整個(gè)數據采集工作的合理安排。分為兩個(gè)階段:數據源表采集及其數據表采集,必須先完成源表的數據采集才能進(jìn)入下一階段。(比如7.1.1個(gè)專(zhuān)業(yè)表不采集好,那么后面會(huì )涉及到專(zhuān)業(yè)表,可能會(huì )出現無(wú)法選擇專(zhuān)業(yè)的情況。)設置審稿人/采集人。點(diǎn)擊管理頁(yè)面工作表記錄行“數據表負責人”欄的“設置”按鈕,打開(kāi)分配新工作負責人管理窗口(2)添加負責人點(diǎn)擊“添加人員負責” 按鈕打開(kāi)分配新負責人的管理窗口??梢詮摹安块T(mén)”下拉框中選擇部門(mén)查找要分配的用戶(hù),也可以直接在“部門(mén)”下拉框中輸入要分配的用戶(hù)的姓名/卡號在“姓名/卡號”輸入框找到它,然后勾選用戶(hù)記錄,點(diǎn)擊“添加”按鈕選擇用戶(hù),然后點(diǎn)擊“保存”按鈕完成分配。如果單擊“刪除負責人”按鈕,當前負責人權限將被刪除。同理,采集表數據負責人的分配方法參考上述說(shuō)明,只需點(diǎn)擊“數據表采集人”欄的“設置”按鈕進(jìn)行設置即可。
  操作步驟與設置reviewer 相同。(4)批量設置采集人員/審批人。點(diǎn)擊批量設置按鈕,依次選擇人員和負責人資料表,點(diǎn)擊保存完成設置。批量刪除功能,操作步驟為類(lèi)似。(5)發(fā)布工作通知。所有工作表都分配好工作計劃后,輸入“工作要求”和“完成時(shí)間”,點(diǎn)擊“發(fā)布工作通知”按鈕,完成發(fā)布工作工作通知。發(fā)布后,采集人登錄系統時(shí)會(huì )自動(dòng)彈出工作任務(wù)提示。注意:“采集其他數據表工作”和“&lt; @采集 數據源表的工作”類(lèi)似。&lt; @3.工作統計。發(fā)布 工作后,您可以在此處查看采集工作的進(jìn)度。4.狀態(tài)設置。該功能可以設置用戶(hù)是否允許采集或更改數據。(1)管理員點(diǎn)擊首頁(yè)“菜單區”的“系統設置”欄,點(diǎn)擊左側菜單“一、系統設置”下的“狀態(tài)設置”選項,打開(kāi)狀態(tài)設置管理頁(yè)面。
  稍后在補充說(shuō)明中說(shuō)明原因,點(diǎn)擊“保存...說(shuō)明”按鈕完成。9.數據上報 數據上報提供給用戶(hù)采集平臺中的狀態(tài)數據上報到教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。數據上報 數據上報給用戶(hù)采集平臺內的狀態(tài)數據上報教育部云數據中心。(1)管理員點(diǎn)擊首頁(yè)“菜單區”中的“系統設置”一欄,然后點(diǎn)擊左側菜單“四、數據點(diǎn)擊“報告”下的“報告數據”選項打開(kāi)上報狀態(tài)數據管理頁(yè)面,然后點(diǎn)擊右側頁(yè)面的“數據上報”按鈕,打開(kāi)上報登錄頁(yè)面。
  注意:頁(yè)面打開(kāi)可能需要一段時(shí)間(因為此時(shí)將生成案例研究的摘要數據),請稍候。(2)填寫(xiě)機構代碼、密碼(登錄云中心的密碼)和驗證碼,點(diǎn)擊“登錄”按鈕開(kāi)始進(jìn)入上報數據管理頁(yè)面。(3) “數據生成”將系統生成采集的狀態(tài)數據作為報告數據。選擇“年份”和“學(xué)校名稱(chēng)”后,點(diǎn)擊“生成”按鈕生成數據。(4)@ &gt; “數據上報”是將生成的數據上報到云端的“高職數據中心”,用戶(hù)可以點(diǎn)擊“上報”按鈕完成上報。注意:(1)上報時(shí),系統不應還有 ” 系統會(huì )自動(dòng)將任務(wù)變?yōu)椤斑M(jìn)行中”狀態(tài);當用戶(hù)完成data采集任務(wù)后,需要進(jìn)入該頁(yè)面點(diǎn)擊“操作”欄中的“完成”按鈕完成任務(wù),任務(wù)變?yōu)椤巴瓿伞睜顟B(tài);如果用戶(hù)任務(wù)到期前未完成任務(wù),系統會(huì )自動(dòng)變?yōu)椤拔赐瓿伞睜顟B(tài)。
  右上角按鈕,備份平臺數據庫。11.2、導出標準版說(shuō)明:如果需要將數據導出到標準版,必須先上報數據,然后登錄“中國職業(yè)教育評估”網(wǎng)站,操作在《高職院校人才培養工作狀況數據采集及管理平臺》中。日常管理包括:(1)按“工作分配”劃分,采集我負責的狀態(tài)數據;(2)默認用戶(hù)采集由系統自動(dòng)分配的狀態(tài)數據)系統(如專(zhuān)職教師,默認可以是2)默認用戶(hù)采集@采集6.表1狀態(tài)數據)。(3)數據管理員審核提交的狀態(tài)數據。注意:當用戶(hù)填寫(xiě)不在權限范圍內的狀態(tài)數據時(shí),系統會(huì )自動(dòng)提示告知。第一步:登錄系統。使用瀏覽器訪(fǎng)問(wèn)平臺網(wǎng)站。然后輸入卡號和密碼,點(diǎn)擊“登錄”按鈕進(jìn)入狀態(tài)數據采集和管理平臺。第 2 步:管理數據。
  勾選要編輯的記錄后,點(diǎn)擊“編輯”按鈕,打開(kāi)修改管理頁(yè)面。(2)更正相應內容后,點(diǎn)擊“保存”按鈕完成。注意:(1)如果用戶(hù)需要刪除一條記錄,可以先查看該記錄,然后點(diǎn)擊“刪除”按鈕刪除已經(jīng)過(guò)采集的狀態(tài)數據。(2)已經(jīng)審核“通過(guò)”的記錄不允許刪除。3、審核數據(1)勾選需要審核的記錄后,點(diǎn)擊“審核”按鈕,打開(kāi)審核記錄管理窗口。(2)選擇“審核結果”并填寫(xiě)“審核備注”,然后點(diǎn)擊“保存”按鈕完成。4.單一表單導入。(&lt; @1)點(diǎn)擊導入按鈕,進(jìn)入單表導入頁(yè)面。(2)點(diǎn)擊右上角下載導入的模板,將數據填入模板,導入即可。注意:?jiǎn)伪韺肟蛇x擇清空數據導入或添加數據。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清空模式導入只會(huì )清空該表。如果是擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。模板中有很多表,但是點(diǎn)擊從哪個(gè)表導入,只能導入該表的數據,其他表不會(huì )導入。選擇清除模式導入只會(huì )清除表格。如果您擔心,請備份數據并操作。

采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 118 次瀏覽 ? 2022-02-13 02:01 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)
  采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便。例如在文章的編輯狀態(tài)時(shí)保存為數據庫;當查詢(xún)操作時(shí)保存為excel、表格等形式;當系統運行時(shí)保存為csv、html、json等格式...可以輕松方便管理數據庫、圖片圖形、多媒體文件、相冊視頻、郵件文檔、表格文檔、pdf文檔、網(wǎng)頁(yè)文檔等。采集管理平臺最主要的就是增加了多源數據的自動(dòng)篩選,比如想抓取php源文件,那我們直接上傳php文件,平臺自動(dòng)篩選出源文件;想抓取ruby源文件,那我們直接下載ruby源文件,平臺自動(dòng)篩選出ruby源文件;想抓取java源文件,那我們直接將java源文件下載下來(lái),平臺自動(dòng)篩選出java源文件;再想抓取excel源文件,那我們下載excel源文件,平臺自動(dòng)篩選出excel源文件;下載其他網(wǎng)頁(yè)源文件,那我們下載其他網(wǎng)頁(yè)源文件..這樣,提高了數據統計的效率。
  采集內容管理平臺是以“采集引擎”為核心,對海量數據進(jìn)行采集后處理,進(jìn)而實(shí)現“對重要數據實(shí)現強控制”的數據管理,實(shí)現對海量數據的采集與管理。采集內容管理平臺不僅可以支持單一“采集引擎”,也可以實(shí)現多個(gè)采集引擎的通力合作。
  目前主流的采集系統都有的缺點(diǎn):不支持異地采集、只支持本地訪(fǎng)問(wèn)本地采集(尤其是地區采集, 查看全部

  采集內容管理平臺(采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便)
  采集內容管理平臺在管理多種文件類(lèi)型數據庫有極大方便。例如在文章的編輯狀態(tài)時(shí)保存為數據庫;當查詢(xún)操作時(shí)保存為excel、表格等形式;當系統運行時(shí)保存為csv、html、json等格式...可以輕松方便管理數據庫、圖片圖形、多媒體文件、相冊視頻、郵件文檔、表格文檔、pdf文檔、網(wǎng)頁(yè)文檔等。采集管理平臺最主要的就是增加了多源數據的自動(dòng)篩選,比如想抓取php源文件,那我們直接上傳php文件,平臺自動(dòng)篩選出源文件;想抓取ruby源文件,那我們直接下載ruby源文件,平臺自動(dòng)篩選出ruby源文件;想抓取java源文件,那我們直接將java源文件下載下來(lái),平臺自動(dòng)篩選出java源文件;再想抓取excel源文件,那我們下載excel源文件,平臺自動(dòng)篩選出excel源文件;下載其他網(wǎng)頁(yè)源文件,那我們下載其他網(wǎng)頁(yè)源文件..這樣,提高了數據統計的效率。
  采集內容管理平臺是以“采集引擎”為核心,對海量數據進(jìn)行采集后處理,進(jìn)而實(shí)現“對重要數據實(shí)現強控制”的數據管理,實(shí)現對海量數據的采集與管理。采集內容管理平臺不僅可以支持單一“采集引擎”,也可以實(shí)現多個(gè)采集引擎的通力合作。
  目前主流的采集系統都有的缺點(diǎn):不支持異地采集、只支持本地訪(fǎng)問(wèn)本地采集(尤其是地區采集,

采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 86 次瀏覽 ? 2022-02-07 17:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)
  概述
  集嘉通達信息資源整合平臺(以下簡(jiǎn)稱(chēng)信息資源整合平臺)是基于非結構化文檔管理的大型智能內容管理系統。發(fā)布的解決方案可以同時(shí)管理文本、圖片、多媒體等信息,并提供全文檢索服務(wù)。它是一個(gè)內容管理、發(fā)布和增值利用的平臺。是各類(lèi)機構建設數字圖書(shū)館、文獻信息系統、開(kāi)發(fā)信息的平臺。服務(wù)的理想平臺。
  功能和特點(diǎn)
  集嘉通達信息資源集成平臺由管理子系統、數據采集子系統、資源數據展示系統三部分組成。
  1、管理子系統實(shí)現了添加、修改、刪除、發(fā)布資源的一整套流程功能;
  2、data采集子系統實(shí)現參與單位數據的批量采集和數據過(guò)濾功能;
  3、資源數據展示系統實(shí)現資源統一檢索、資源數據多樣化展示、資源在線(xiàn)瀏覽、資源下載等,同時(shí)對資源和訪(fǎng)問(wèn)量進(jìn)行分析,形成報表。
  集嘉通達信息資源整合平臺具有以下五個(gè)功能特點(diǎn):
  1、資源全覆蓋,可以整合整合各種形式的信息資源,格式不限,如文字、圖片、多媒體等格式的信息;
  2、檢索方便,平臺上,一鍵檢索可以找到精準的信息資源;
  3、檢索速度快,利用大數據檢索技術(shù)可實(shí)現1s內數據檢索;
  4、應用方式多樣,系統提供關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、資源智能關(guān)聯(lián)、熱搜詞推薦等功能;
  5、靈活的資源庫和資源配置,更易于擴展和維護。
  適用對象及案例
  適用對象一:政府機關(guān)、科研院所等機構、學(xué)校、圖書(shū)館及事業(yè)單位;
  適用對象二:某一領(lǐng)域的平臺型、服務(wù)型企業(yè)或機構;
  適用對象三:其他有信息資源整合和信息資源檢索需求的企事業(yè)單位。
  應用案例:北京體育大學(xué)、北京盲文圖書(shū)館、中國船舶重工集團公司第714研究所、長(cháng)春航空航天大學(xué)、西南大學(xué)。
  應用場(chǎng)景
  信息資源整合平臺的應用行業(yè)不受限制,場(chǎng)景主要集中在企業(yè)和行業(yè)的信息整合和信息檢索,包括但不限于以下場(chǎng)景。
  場(chǎng)景一:建設學(xué)校圖書(shū)館信息資源整合平臺
  學(xué)校圖書(shū)館藏書(shū)、文獻、期刊種類(lèi)繁多,數量龐大,形式多樣,包括電子書(shū)和實(shí)體書(shū)。同時(shí),在平臺的使用中,也有很多功能需求,一般包括增加書(shū)籍、修改書(shū)籍、刪除書(shū)籍、統計書(shū)籍等;找書(shū)、借書(shū)、還書(shū)、借書(shū)統計;申請讀卡、刪除讀卡、修改讀卡;添加管理員、修改管理員信息、刪除管理員等。
  集家通達信息資源整合平臺可同時(shí)管理文字、圖片、多媒體等信息,提供全文檢索服務(wù)。系統按照標準規范構建,具有多種檢索方式。它是用于內容管理、發(fā)布和增值利用的信息資源。綜合平臺。
  場(chǎng)景二:行業(yè)平臺建設——CNKI、學(xué)信、錢(qián)途等
  行業(yè)信息資源的整合利用變得越來(lái)越有價(jià)值。各行各業(yè)都有自己的行業(yè)信息資源整合平臺,如學(xué)術(shù)文獻領(lǐng)域的CNKI、學(xué)歷證書(shū)領(lǐng)域的學(xué)信、設計與辦公領(lǐng)域的千圖等。行業(yè)平臺整合行業(yè)資源,形成資源門(mén)戶(hù)網(wǎng)站,從而獲取客戶(hù),為客戶(hù)提供統一的一、快速精準的資源搜索和下載服務(wù)。
  價(jià)值
  5.1 整合企事業(yè)單位內部信息,加強部門(mén)間信息交流
  大型企事業(yè)單位,部門(mén)多,容易出現“信息孤島”現象。部門(mén)之間的信息無(wú)法相互溝通。有多個(gè)接口采集,重復輸入,重復工作,導致信息缺乏一致性。即使部門(mén)之間有共享機制,操作也可能缺乏及時(shí)性和便利性,導致部門(mén)間信息利用率低,效率低,影響業(yè)務(wù)的順利開(kāi)展。
  集嘉信息資源整合平臺可以整合各部門(mén)的數據信息,不限制數據格式,如文字、圖片、多媒體等。平臺提供多種檢索方式,1s可實(shí)現數據檢索,檢索結果快速、簡(jiǎn)便、準確,提高部門(mén)工作效率。
  5.2 企業(yè)或機構信息整合提升外部客戶(hù)服務(wù)質(zhì)量
  擁有龐大客戶(hù)群的企業(yè)或機構,每天可能有大量客戶(hù)在自己的平臺上進(jìn)行信息檢索服務(wù),這對平臺-系統安全要求、建設標準和規范要求、信息資源處理要求等提出了很高的要求。 ,信息檢索和呈現的要求。
  集嘉信息資源集成平臺具有優(yōu)秀的系統安全措施建設、信息資源標準規范建設(模板管理、用戶(hù)分級管理等)、科學(xué)的數據處理建設、各種檢索和信息展示的功能應用,如關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、熱搜詞推薦等,為客戶(hù)提供快速、準確、便捷的搜索體驗。
  5.3 科研、高校單位整合本領(lǐng)域信息,提升科研水平
  有科研項目的企事業(yè)單位,或擁有龐大信息資源的單位或機構,如科研院所、高校等,信息使用者可以通過(guò)信息資源整合平臺直接、快捷、方便地檢索和提取自己的信息. 所需的信息可以大大提高效率。 查看全部

  采集內容管理平臺(應用場(chǎng)景應用行業(yè)領(lǐng)域不限,場(chǎng)景集中在企業(yè)或機構)
  概述
  集嘉通達信息資源整合平臺(以下簡(jiǎn)稱(chēng)信息資源整合平臺)是基于非結構化文檔管理的大型智能內容管理系統。發(fā)布的解決方案可以同時(shí)管理文本、圖片、多媒體等信息,并提供全文檢索服務(wù)。它是一個(gè)內容管理、發(fā)布和增值利用的平臺。是各類(lèi)機構建設數字圖書(shū)館、文獻信息系統、開(kāi)發(fā)信息的平臺。服務(wù)的理想平臺。
  功能和特點(diǎn)
  集嘉通達信息資源集成平臺由管理子系統、數據采集子系統、資源數據展示系統三部分組成。
  1、管理子系統實(shí)現了添加、修改、刪除、發(fā)布資源的一整套流程功能;
  2、data采集子系統實(shí)現參與單位數據的批量采集和數據過(guò)濾功能;
  3、資源數據展示系統實(shí)現資源統一檢索、資源數據多樣化展示、資源在線(xiàn)瀏覽、資源下載等,同時(shí)對資源和訪(fǎng)問(wèn)量進(jìn)行分析,形成報表。
  集嘉通達信息資源整合平臺具有以下五個(gè)功能特點(diǎn):
  1、資源全覆蓋,可以整合整合各種形式的信息資源,格式不限,如文字、圖片、多媒體等格式的信息;
  2、檢索方便,平臺上,一鍵檢索可以找到精準的信息資源;
  3、檢索速度快,利用大數據檢索技術(shù)可實(shí)現1s內數據檢索;
  4、應用方式多樣,系統提供關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、資源智能關(guān)聯(lián)、熱搜詞推薦等功能;
  5、靈活的資源庫和資源配置,更易于擴展和維護。
  適用對象及案例
  適用對象一:政府機關(guān)、科研院所等機構、學(xué)校、圖書(shū)館及事業(yè)單位;
  適用對象二:某一領(lǐng)域的平臺型、服務(wù)型企業(yè)或機構;
  適用對象三:其他有信息資源整合和信息資源檢索需求的企事業(yè)單位。
  應用案例:北京體育大學(xué)、北京盲文圖書(shū)館、中國船舶重工集團公司第714研究所、長(cháng)春航空航天大學(xué)、西南大學(xué)。
  應用場(chǎng)景
  信息資源整合平臺的應用行業(yè)不受限制,場(chǎng)景主要集中在企業(yè)和行業(yè)的信息整合和信息檢索,包括但不限于以下場(chǎng)景。
  場(chǎng)景一:建設學(xué)校圖書(shū)館信息資源整合平臺
  學(xué)校圖書(shū)館藏書(shū)、文獻、期刊種類(lèi)繁多,數量龐大,形式多樣,包括電子書(shū)和實(shí)體書(shū)。同時(shí),在平臺的使用中,也有很多功能需求,一般包括增加書(shū)籍、修改書(shū)籍、刪除書(shū)籍、統計書(shū)籍等;找書(shū)、借書(shū)、還書(shū)、借書(shū)統計;申請讀卡、刪除讀卡、修改讀卡;添加管理員、修改管理員信息、刪除管理員等。
  集家通達信息資源整合平臺可同時(shí)管理文字、圖片、多媒體等信息,提供全文檢索服務(wù)。系統按照標準規范構建,具有多種檢索方式。它是用于內容管理、發(fā)布和增值利用的信息資源。綜合平臺。
  場(chǎng)景二:行業(yè)平臺建設——CNKI、學(xué)信、錢(qián)途等
  行業(yè)信息資源的整合利用變得越來(lái)越有價(jià)值。各行各業(yè)都有自己的行業(yè)信息資源整合平臺,如學(xué)術(shù)文獻領(lǐng)域的CNKI、學(xué)歷證書(shū)領(lǐng)域的學(xué)信、設計與辦公領(lǐng)域的千圖等。行業(yè)平臺整合行業(yè)資源,形成資源門(mén)戶(hù)網(wǎng)站,從而獲取客戶(hù),為客戶(hù)提供統一的一、快速精準的資源搜索和下載服務(wù)。
  價(jià)值
  5.1 整合企事業(yè)單位內部信息,加強部門(mén)間信息交流
  大型企事業(yè)單位,部門(mén)多,容易出現“信息孤島”現象。部門(mén)之間的信息無(wú)法相互溝通。有多個(gè)接口采集,重復輸入,重復工作,導致信息缺乏一致性。即使部門(mén)之間有共享機制,操作也可能缺乏及時(shí)性和便利性,導致部門(mén)間信息利用率低,效率低,影響業(yè)務(wù)的順利開(kāi)展。
  集嘉信息資源整合平臺可以整合各部門(mén)的數據信息,不限制數據格式,如文字、圖片、多媒體等。平臺提供多種檢索方式,1s可實(shí)現數據檢索,檢索結果快速、簡(jiǎn)便、準確,提高部門(mén)工作效率。
  5.2 企業(yè)或機構信息整合提升外部客戶(hù)服務(wù)質(zhì)量
  擁有龐大客戶(hù)群的企業(yè)或機構,每天可能有大量客戶(hù)在自己的平臺上進(jìn)行信息檢索服務(wù),這對平臺-系統安全要求、建設標準和規范要求、信息資源處理要求等提出了很高的要求。 ,信息檢索和呈現的要求。
  集嘉信息資源集成平臺具有優(yōu)秀的系統安全措施建設、信息資源標準規范建設(模板管理、用戶(hù)分級管理等)、科學(xué)的數據處理建設、各種檢索和信息展示的功能應用,如關(guān)鍵詞搜索、全文搜索、高級搜索、跨庫搜索、在線(xiàn)瀏覽、熱搜詞推薦等,為客戶(hù)提供快速、準確、便捷的搜索體驗。
  5.3 科研、高校單位整合本領(lǐng)域信息,提升科研水平
  有科研項目的企事業(yè)單位,或擁有龐大信息資源的單位或機構,如科研院所、高校等,信息使用者可以通過(guò)信息資源整合平臺直接、快捷、方便地檢索和提取自己的信息. 所需的信息可以大大提高效率。

采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 104 次瀏覽 ? 2022-02-06 16:00 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))
  采集內容管理平臺,可以根據類(lèi)型收集各類(lèi)數據,簡(jiǎn)單易用,操作靈活,可自定義語(yǔ)言和數據庫管理后臺等。如何接入采集功能1.加群,聯(lián)系助理,注明采集內容管理平臺(有專(zhuān)門(mén)的qq群,可加入或私聊助理)2.在公眾號內編輯,內容及注意事項:2.1推薦文章,(推薦的文章內容須是公眾號本身定位相關(guān)的,若某篇文章為廣告軟文,請勿推薦)2.2優(yōu)質(zhì)文章,(含自定義語(yǔ)言?xún)热莸奈恼拢?.3自動(dòng)發(fā)布內容,(可以使用采集工具,如:xml工具等)2.4.點(diǎn)擊接收,輸入接收地址即可發(fā)送到采集平臺,無(wú)需加群。
  2.5.登錄采集后臺,并設置好采集內容類(lèi)型等,2.6.填寫(xiě)電話(huà)號碼及個(gè)人身份信息后,手機驗證方可使用接收功能3.關(guān)注采集微信號后(公眾號、個(gè)人號均可),點(diǎn)擊接收原文鏈接(需采集文章后臺設置為公眾號推薦),可以自定義輸入語(yǔ)言,并對該文章進(jìn)行點(diǎn)擊搜索,只要符合條件,即可直接搜索,不需要另外下載采集工具(搜狗或iis等)。
  4.請用手機號注冊,安卓的需要注冊,請配置手機號綁定登錄。接收平臺自動(dòng)發(fā)送到你微信號的接收地址5.請專(zhuān)注于采集,禁止添加諸如學(xué)習、交流、交友等功能,接收平臺發(fā)送文章,一經(jīng)審核,拒絕接收。接收地址:.網(wǎng)站采集接收更方便,但需要注冊帳號,默認為網(wǎng)站鏈接。安卓的可以對接手機號,ios的可以對接手機號驗證??梢蕴D中文全文閱讀,但全文不支持接收文字。信息安全方面,xml采集工具防止偽造是我們的主要優(yōu)勢。 查看全部

  采集內容管理平臺(采集內容管理平臺,如何接入采集功能?(一))
  采集內容管理平臺,可以根據類(lèi)型收集各類(lèi)數據,簡(jiǎn)單易用,操作靈活,可自定義語(yǔ)言和數據庫管理后臺等。如何接入采集功能1.加群,聯(lián)系助理,注明采集內容管理平臺(有專(zhuān)門(mén)的qq群,可加入或私聊助理)2.在公眾號內編輯,內容及注意事項:2.1推薦文章,(推薦的文章內容須是公眾號本身定位相關(guān)的,若某篇文章為廣告軟文,請勿推薦)2.2優(yōu)質(zhì)文章,(含自定義語(yǔ)言?xún)热莸奈恼拢?.3自動(dòng)發(fā)布內容,(可以使用采集工具,如:xml工具等)2.4.點(diǎn)擊接收,輸入接收地址即可發(fā)送到采集平臺,無(wú)需加群。
  2.5.登錄采集后臺,并設置好采集內容類(lèi)型等,2.6.填寫(xiě)電話(huà)號碼及個(gè)人身份信息后,手機驗證方可使用接收功能3.關(guān)注采集微信號后(公眾號、個(gè)人號均可),點(diǎn)擊接收原文鏈接(需采集文章后臺設置為公眾號推薦),可以自定義輸入語(yǔ)言,并對該文章進(jìn)行點(diǎn)擊搜索,只要符合條件,即可直接搜索,不需要另外下載采集工具(搜狗或iis等)。
  4.請用手機號注冊,安卓的需要注冊,請配置手機號綁定登錄。接收平臺自動(dòng)發(fā)送到你微信號的接收地址5.請專(zhuān)注于采集,禁止添加諸如學(xué)習、交流、交友等功能,接收平臺發(fā)送文章,一經(jīng)審核,拒絕接收。接收地址:.網(wǎng)站采集接收更方便,但需要注冊帳號,默認為網(wǎng)站鏈接。安卓的可以對接手機號,ios的可以對接手機號驗證??梢蕴D中文全文閱讀,但全文不支持接收文字。信息安全方面,xml采集工具防止偽造是我們的主要優(yōu)勢。

采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 116 次瀏覽 ? 2022-02-06 11:01 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)
  采集內容管理平臺在實(shí)際項目中主要提供:采集數據,批量生成分析報表,建立數據庫操作環(huán)境:windows/linux效果展示:采集本地數據:采集公眾號文章的url地址需要完整源碼的小伙伴,可以去公眾號下載獲取完整源碼還有其他好玩的干貨文章,
  可以使用odoo數據庫系統哦,odoo1.5.0revision1.2版本新增功能已經(jīng)跟上了,對采集用戶(hù)的限制也很小~準確的說(shuō),是odoo使用hadoop從mysql讀取數據。使用建議可以看看1.5.0中的新功能,通過(guò)使用url鏈接可以快速查看和更新采集到的結果,有更豐富的查詢(xún)形式。相關(guān)推薦odoo建模|odoo發(fā)布20000條數據告訴你哪些數據采集是穩妥的隨時(shí)隨地開(kāi)啟數據采集看得見(jiàn),也得到!。
  采集本地數據:你可以在你想采集的地方粘貼鏈接,
  1.2版本添加了url獲取功能,以上一段截圖僅供參考,采集對象需要修改后才能繼續使用。以下截圖截至20180725處:獲取完整采集數據的步驟:1.采集url和參數2.修改配置信息3.參數上傳、修改4.fileformat轉換配置信息5.上傳圖片至服務(wù)器注意:1.關(guān)于采集url:在odoo官網(wǎng)上下載最新版本,在firefox瀏覽器中打開(kāi),或手機瀏覽器打開(kāi)。
  2.采集頁(yè)面:在provider中選擇登錄賬號和密碼,然后將頁(yè)面的url傳遞到服務(wù)器中。特別說(shuō)明:odoo1.3版本已經(jīng)新增了url寫(xiě)入數據庫功能,但是各位可能還是會(huì )提示在配置頁(yè)面中顯示采集出錯的提示,這個(gè)時(shí)候可以嘗試改變provider的url獲取方式,將url導入數據庫中,這樣就不會(huì )顯示數據庫中的url了。 查看全部

  采集內容管理平臺(odoo1.5.0revision1.2版本新增功能介紹及注意事項)
  采集內容管理平臺在實(shí)際項目中主要提供:采集數據,批量生成分析報表,建立數據庫操作環(huán)境:windows/linux效果展示:采集本地數據:采集公眾號文章的url地址需要完整源碼的小伙伴,可以去公眾號下載獲取完整源碼還有其他好玩的干貨文章,
  可以使用odoo數據庫系統哦,odoo1.5.0revision1.2版本新增功能已經(jīng)跟上了,對采集用戶(hù)的限制也很小~準確的說(shuō),是odoo使用hadoop從mysql讀取數據。使用建議可以看看1.5.0中的新功能,通過(guò)使用url鏈接可以快速查看和更新采集到的結果,有更豐富的查詢(xún)形式。相關(guān)推薦odoo建模|odoo發(fā)布20000條數據告訴你哪些數據采集是穩妥的隨時(shí)隨地開(kāi)啟數據采集看得見(jiàn),也得到!。
  采集本地數據:你可以在你想采集的地方粘貼鏈接,
  1.2版本添加了url獲取功能,以上一段截圖僅供參考,采集對象需要修改后才能繼續使用。以下截圖截至20180725處:獲取完整采集數據的步驟:1.采集url和參數2.修改配置信息3.參數上傳、修改4.fileformat轉換配置信息5.上傳圖片至服務(wù)器注意:1.關(guān)于采集url:在odoo官網(wǎng)上下載最新版本,在firefox瀏覽器中打開(kāi),或手機瀏覽器打開(kāi)。
  2.采集頁(yè)面:在provider中選擇登錄賬號和密碼,然后將頁(yè)面的url傳遞到服務(wù)器中。特別說(shuō)明:odoo1.3版本已經(jīng)新增了url寫(xiě)入數據庫功能,但是各位可能還是會(huì )提示在配置頁(yè)面中顯示采集出錯的提示,這個(gè)時(shí)候可以嘗試改變provider的url獲取方式,將url導入數據庫中,這樣就不會(huì )顯示數據庫中的url了。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 131 次瀏覽 ? 2022-02-05 03:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述是“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。以分析報告為契機,可以根據需要對開(kāi)發(fā)團隊進(jìn)行培訓,身邊的案例可以更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述是“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。以分析報告為契機,可以根據需要對開(kāi)發(fā)團隊進(jìn)行培訓,身邊的案例可以更有說(shuō)服力。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 156 次瀏覽 ? 2022-01-30 13:07 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集
  采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現
  規則執行
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理
  規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示
  對象審計結果概述
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 117 次瀏覽 ? 2022-01-30 13:06 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))
  模塊劃分
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  五、數據采集
  采集內容
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的信息,基本上所有需要的信息都可以采集獲得;MySQL 函數相對能采集獲取的信息較少。
  表中的“復選標記+星號”表示非預定作業(yè)已完成,但稍后從圖書(shū)館實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  六、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,會(huì )更清楚。從分類(lèi)的角度來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,您也可以對規則有一個(gè)清晰的了解。
  規則定義(對象級別)
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置規則很多。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是通過(guò)規則的輸入參數來(lái)確認的。參數包括表記錄數和表的物理大小。該規則的一般描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是直接從AWR中按時(shí)間段提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是通過(guò)使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中。今天整個(gè)審計平臺,除了連接pt工具的部分,使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  七、平臺實(shí)現
  規則執行
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  第二張圖是代碼實(shí)現的總結。
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。這主要是關(guān)于資源的消耗。
  八、系統管理
  規則管理
  在介紹了一些界面之后,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  配置好規則后,就可以在這里完成任務(wù)發(fā)布的工作了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的時(shí)序策略還是以天為單位,所以不能選擇當天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計的類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計持續時(shí)間會(huì )有所不同,通常在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作已完成,可以查看或導出審計結果。
  九、結果展示
  對象審計結果概述
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審查對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我們擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  這部分是對象審計的詳細部分。對應每條規則的詳細狀態(tài),您可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  將顯示執行計劃這一部分的概覽,類(lèi)似于主題的狀態(tài)。也是每條規則的扣減狀態(tài)。
  執行計劃審核結果詳情
  這部分是執行計劃的詳細部分。
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。要約一個(gè)小的知識庫,便于開(kāi)發(fā)者優(yōu)化。后期平臺二期會(huì )做更精準的優(yōu)化引擎部分,并擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA 可以根據這些信息做出一些初步的優(yōu)化判斷。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  十、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  十一、驅動(dòng)進(jìn)程
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,減輕了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統運行狀況,掌握第一手資料??焖倭私飧鱾€(gè)業(yè)務(wù)系統的質(zhì)量并進(jìn)行試點(diǎn)選型。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報狀態(tài)。以分析報告為契機,可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(【干貨】Oracle模塊劃分總結(規則解析概要))
  模塊劃分
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  五、數據采集
  采集內容
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的信息,基本上所有需要的信息都可以采集獲得;MySQL 函數相對能采集獲取的信息較少。
  表中的“復選標記+星號”表示非預定作業(yè)已完成,但稍后從圖書(shū)館實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  六、規則分析
  概述
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,會(huì )更清楚。從分類(lèi)的角度來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,您也可以對規則有一個(gè)清晰的了解。
  規則定義(對象級別)
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置規則很多。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是通過(guò)規則的輸入參數來(lái)確認的。參數包括表記錄數和表的物理大小。該規則的一般描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是直接從AWR中按時(shí)間段提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是通過(guò)使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中。今天整個(gè)審計平臺,除了連接pt工具的部分,使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle部分也形成了json格式的存儲。
  規則執行(執行計劃)
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  七、平臺實(shí)現
  規則執行
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  第二張圖是代碼實(shí)現的總結。
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。這主要是關(guān)于資源的消耗。
  八、系統管理
  規則管理
  在介紹了一些界面之后,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  配置好規則后,就可以在這里完成任務(wù)發(fā)布的工作了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的時(shí)序策略還是以天為單位,所以不能選擇當天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計的類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計持續時(shí)間會(huì )有所不同,通常在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作已完成,可以查看或導出審計結果。
  九、結果展示
  對象審計結果概述
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審查對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初就有些爭議。我們擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  這部分是對象審計的詳細部分。對應每條規則的詳細狀態(tài),您可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  將顯示執行計劃這一部分的概覽,類(lèi)似于主題的狀態(tài)。也是每條規則的扣減狀態(tài)。
  執行計劃審核結果詳情
  這部分是執行計劃的詳細部分。
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。要約一個(gè)小的知識庫,便于開(kāi)發(fā)者優(yōu)化。后期平臺二期會(huì )做更精準的優(yōu)化引擎部分,并擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA 可以根據這些信息做出一些初步的優(yōu)化判斷。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  十、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  十一、驅動(dòng)進(jìn)程
  該平臺在宜信運營(yíng)以來(lái),已經(jīng)為多個(gè)系統提供了審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,減輕了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統運行狀況,掌握第一手資料??焖倭私飧鱾€(gè)業(yè)務(wù)系統的質(zhì)量并進(jìn)行試點(diǎn)選型。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報狀態(tài)。以分析報告為契機,可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 368 次瀏覽 ? 2022-01-30 13:03 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集 采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則解析總結說(shuō)明
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle 部分也以 json 格式存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現規則實(shí)現
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示對象審核結果概覽
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已為多個(gè)系統提供審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。 查看全部

  采集內容管理平臺(Oracle模塊劃分總結一下(二):數據采集、規則解析)
  模塊劃分
  
  綜上所述,平臺主要由以上四個(gè)模塊組成:數據采集、規則分析、系統管理、結果展示。后面會(huì )詳細介紹不同模塊的實(shí)現。
  5、數據采集 采集內容
  
  我們先來(lái)看看 data采集 模塊。從表中可以看出,兩種數據庫的采集的內容是不同的。
  Oracle提供了豐富的資料,基本上需要的都可以采集;MySQL函數信息相對較少,可以采集。
  表中的“復選標記+星號”表示非計劃作業(yè)已完成,但稍后會(huì )實(shí)時(shí)檢索。下面對各部分的采集內容進(jìn)行簡(jiǎn)要說(shuō)明。
  這些信息將作為后續審核的基礎。
  采集原理
  
  下面簡(jiǎn)單介紹一下采集的原理和原理:
  6、規則解析總結說(shuō)明
  下面介紹整個(gè)系統的核心部分——規則解析模塊。它的作用是根據定義的規則對采集的數據進(jìn)行審核,過(guò)濾掉違反規則的數據。對過(guò)濾后的數據進(jìn)行評分和記錄,以供后續生成審計報告。同時(shí),還會(huì )記錄一些額外的信息,以輔助一些判斷工作。
  這里有一個(gè)核心概念——“規則”。后面可以看到內置規則的定義,大家會(huì )比較清楚。從分類(lèi)上來(lái)看,大致可以分為以下幾類(lèi)。
  規則定義
  
  這是規則體的聲明對象。我將解釋每個(gè)字段的含義,以便大家對規則有一個(gè)清晰的認識。
  規則定義(對象級別)
  
  我們先來(lái)看第一類(lèi)規則——對象規則。這是一組針對數據庫對象設置的規則。上表顯示了一些示例。常見(jiàn)的對象,如表、分區、索引、字段、函數、存儲過(guò)程、觸發(fā)器、約束、序列等,都是審計對象。以表格為例,內置了很多規則。
  例如:第一個(gè)“大表太多”。表示數據庫中的大表數量超過(guò)了規則定義的閾值。這里的大表是由規則的輸入參數決定的。參數包括表記錄數和表的物理大小。該規則的總體描述為“數據庫中超過(guò)指定大小的表數或指定記錄數超過(guò)指定閾值,觸發(fā)審計規則”。其他對象的規則類(lèi)似。
  規則實(shí)現(對象級別)
  
  對象規則的實(shí)現部分比較簡(jiǎn)單。除個(gè)別規則外,基本都是查詢(xún)數據字典信息,然后根據規則的定義進(jìn)行判斷。上面的例子是一個(gè)索引的規則實(shí)現,查詢(xún)數據字典信息。
  規則定義(執行計劃級別)
  
  第二類(lèi)規則是執行計劃類(lèi)型的規則,也分為幾類(lèi)。比如訪(fǎng)問(wèn)路徑類(lèi)、表間關(guān)聯(lián)類(lèi)、類(lèi)型轉換類(lèi)、綁定變量類(lèi)等。
  以最常見(jiàn)的訪(fǎng)問(wèn)路徑類(lèi)為例進(jìn)行說(shuō)明。比如最常見(jiàn)的規則“大表掃描”。表示在執行SQL語(yǔ)句時(shí),對大表進(jìn)行訪(fǎng)問(wèn),訪(fǎng)問(wèn)路徑為全表掃描的形式。該規則的輸入參數包括大表的定義(物理大小或記錄數);輸出部分包括表名、表大小和附加信息(包括整個(gè)執行計劃、指定大表的統計信息等)。
  這些規則所針對的數據源是從在線(xiàn)數據庫中獲取的。Oracle部分是按時(shí)間段直接從AWR中提取出來(lái)的,MySQL部分是通過(guò)explain命令查數據庫得到的。
  信息存儲格式
  
  這里特別說(shuō)明,保存執行計劃時(shí),使用的是MongoDB等文檔數據庫。目的是利用其無(wú)模式特性,方便兼容不同數據庫和版本的執行計劃差異。都可以存儲在一個(gè)集合中,后續的規則審核也是使用mongo中的查詢(xún)語(yǔ)句來(lái)實(shí)現的。這也是一開(kāi)始引入mongo的初衷,其他類(lèi)型的信息后面會(huì )放到庫中?,F在整個(gè)審計平臺,除了連接pt工具的部分使用MySQL,其余都在MongoDB中。另外,MySQL庫可以直接輸出json格式的執行計劃,存儲非常方便;Oracle 部分也以 json 格式存儲。
  規則執行(執行計劃)
  
  左側是 Oracle 執行計劃在 MongoDB 中的存儲方式。其實(shí)就是將sqlplan字典數據插入到mongo中。右邊是一個(gè)規則實(shí)現的例子,是一個(gè)基于mongo的查詢(xún)語(yǔ)句。稍后我們將看到一個(gè)詳細的示例。
  7、平臺實(shí)現規則實(shí)現
  
  這是“大表全表掃描”規則的示例。以上是Oracle中數據字典保存的執行計劃,以下是Mongo中保存的??梢钥闯鍪峭耆u的。
  
  基于這種結構,如何實(shí)現規則過(guò)濾?其實(shí)是通過(guò)mongo中的find語(yǔ)句實(shí)現的。以下是該語(yǔ)句的執行步驟的詳細說(shuō)明。
  規則執行(執行計劃)
  這部分是一個(gè)在 MySQL 中實(shí)現分層結果存儲的例子。
  
  第一個(gè)圖顯示了原創(chuàng )的執行計劃。
  
  第二張圖是代碼實(shí)現的總結。
  
  第三張圖片是它實(shí)際保存在庫中的樣子。核心部分是item_level的生成。
  規則定義(文本級別)
  
  第三種規則是基于文本的規則,它是描述 SQL 語(yǔ)句的文本特征的規則,與數據庫類(lèi)型無(wú)關(guān)。在實(shí)現上,通過(guò)常規的文本匹配或程序進(jìn)行處理。其主要目的是規范開(kāi)發(fā)者的 SQL 編寫(xiě)方式,避免復雜、性能差、不規范的 SQL 編寫(xiě)方式。
  規則實(shí)現(文本級別)
  
  本節介紹如何實(shí)現文本規則。第一個(gè)示例 bad_join 是通過(guò)常規文本匹配實(shí)現的簡(jiǎn)單規則。第二個(gè)例子,sub_query,是通過(guò)程序判斷括號的嵌套來(lái)判斷子查詢(xún)(或多級子查詢(xún))。
  規則定義(執行功能級別)
  
  最后一類(lèi)規則是要素類(lèi)的實(shí)現。這部分與數據庫密切相關(guān),過(guò)濾掉符合一定執行特征的語(yǔ)句。這些語(yǔ)句不一定是低效的,它們可能只是未來(lái)優(yōu)化的重點(diǎn),或者是一些優(yōu)化收益最高的語(yǔ)句。主要有一些資源消耗等等。
  8、系統管理規則管理
  
  后來(lái)通過(guò)一些界面展示,介紹了平臺的功能。
  第一部分是系統管理模塊中的規則管理部分。在本節中,您可以完成添加自己的規則。它的核心是規則實(shí)現部分,以SQL語(yǔ)句、Mongo查詢(xún)語(yǔ)句、自定義Python文件的形式定義規則實(shí)現體。自定義規則的基礎是已有的爬取數據源,定義者需要熟悉已有的數據結構和含義。當前不支持自定義爬網(wǎng)數據源。
  
  對于已定義的規則,您可以在此處完成規則修改。主要配置規則狀態(tài)、閾值、扣減項。
  任務(wù)管理
  
  規則配置好后,任務(wù)發(fā)布的工作就可以在這里完成了。
  以上是發(fā)布規則任務(wù)的界面。選擇好數據源(ip、port、schema)后,選擇審計類(lèi)型和審計日期。目前審計數據源的計時(shí)策略仍然是以天為單位,所以不能選擇今天的日期。
  任務(wù)發(fā)布后,您可以在任務(wù)結果查看界面觀(guān)察執行狀態(tài)。根據審計類(lèi)型、數據源對象的數量和語(yǔ)句的數量,審計的持續時(shí)間是可變的,一般在 5 分鐘內。當審計工作狀態(tài)為“成功”時(shí),表示審計工作完成,可以查看或導出審計結果。
  9、結果展示對象審核結果概覽
  
  上圖是對象審計報告的示例。報告的開(kāi)頭是概覽頁(yè)面。在審計報告中集中展示各項規則和扣減;并通過(guò)餅圖顯示它們的比例。這使我們能夠首先關(guān)注核心問(wèn)題。
  在頂部,您還可以觀(guān)察到規則總分的顯示。這是按照百分制將規則扣分換算得到的分數。分數越高,違規越少,審計對象的質(zhì)量越高?!耙巹t總分”的引入在設計之初是有爭議的,擔心有這個(gè)指標會(huì )打擊開(kāi)發(fā)者的積極性,不利于平臺的推廣和使用。這里有幾點(diǎn)可以說(shuō)明。
  對象審核結果詳細信息
  
  這部分是對象審計的詳細部分,對應每條規則的詳細信息,可以在左側的鏈接中進(jìn)一步查看對象信息。由于篇幅限制,這里就不展示了。
  執行計劃評審結果概覽
  
  這部分執行計劃的概覽顯示,類(lèi)似于對象的情況。也是每條規則的扣分。
  執行計劃審核結果詳情
  
  這部分是執行計劃的詳細部分。
  
  展開(kāi)后,您可以看到每個(gè)規則違規的細分。上圖是違反全表掃描規則的詳細部分。
  以上是一些通用的解決方案說(shuō)明。此處描述了可能觸發(fā)此類(lèi)規則的情況和解決方案。相當于一個(gè)小知識庫,方便開(kāi)發(fā)者優(yōu)化。之后在平臺二期,我們會(huì )對引擎部分做更精準的優(yōu)化,并且會(huì )擴充這部分。
  下面是每條違規語(yǔ)句的狀態(tài),我們可以看到語(yǔ)句文本、執行計劃、關(guān)聯(lián)信息(比如這條規則的大表名)等,您也可以進(jìn)一步點(diǎn)擊語(yǔ)句展開(kāi)信息。
  
  
  這部分是每條 SQL 的信息,包括語(yǔ)句文本、執行計劃、執行特征和關(guān)聯(lián)的對象統計信息。DBA可以根據這些信息做一些初步的優(yōu)化判斷工作。
  此外,平臺還提供了導出功能??梢詫С鰹閑x??cel文件供用戶(hù)下載查看。它顯示在這里。
  10、我們遇到的坑
  在實(shí)際開(kāi)發(fā)過(guò)程中,遇到了很多問(wèn)題。我們這里簡(jiǎn)單介紹兩個(gè),例如:
  MySQL在解析json格式執行計劃時(shí)暴露的問(wèn)題...
  【Session進(jìn)入睡眠狀態(tài),假死】
  解決方法:在執行會(huì )話(huà)前設置wait_timtout=3,這個(gè)時(shí)間根據實(shí)際情況調整。
  【數據量太大,很久沒(méi)有結果】
  session處于查詢(xún)狀態(tài),但是數據量很大或者因為數據庫對format=json的支持不是很好,長(cháng)時(shí)間解析不出來(lái),會(huì )影響其他session。
  解決方法:使用 pt-kill 工具終止會(huì )話(huà)。為了防止誤殺,可以標記“eXplAin format=json”,然后使用pt-kill識別eXplAin關(guān)鍵字。
  11、推進(jìn)進(jìn)程
  
  該平臺在宜信運營(yíng)以來(lái),已為多個(gè)系統提供審計報告,大大加快了數據庫結構和SQL優(yōu)化的速度,緩解了DBA的日常工作壓力。在工作實(shí)施過(guò)程中,我們也探索了一套實(shí)施方法。平臺開(kāi)源后,如果朋友使用,可以參考實(shí)現。
  信息采集階段
  數據庫系統的操作,掌握第一手資料??焖倭私飧鳂I(yè)務(wù)系統質(zhì)量,做好試點(diǎn)選型工作。
  人工分析階段
  關(guān)鍵系統,人工干預分析。針對規則審核中暴露的核心問(wèn)題,“點(diǎn)對面”,有針對性的分析優(yōu)化報告。
  溝通訓練階段
  主動(dòng)上門(mén)與開(kāi)發(fā)團隊溝通匯報情況。借分析報告的機會(huì ),可以對開(kāi)發(fā)團隊進(jìn)行必要的培訓,結合身邊的案例,更有說(shuō)服力。

采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 151 次瀏覽 ? 2022-01-30 02:19 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)
  SXcms是一個(gè)基于平臺的網(wǎng)站內容管理系統,默認支持SQLServer數據庫,可以擴展支持Access、MySQL、Oracle等數據庫。
  類(lèi)似軟件
  印記
  軟件地址
  后臺執行任務(wù):頁(yè)面生成、采集等任務(wù)在后臺執行,無(wú)需打開(kāi)網(wǎng)頁(yè)等待,節省您的工作時(shí)間
  原型模塊:自由擴展列字段和參數,滿(mǎn)足您的網(wǎng)站特殊定制,擴展您的個(gè)性化應用規劃任務(wù)
  它可以在固定的時(shí)間和周期內更新整個(gè)或部分列或其他任務(wù),從而實(shí)現網(wǎng)站無(wú)人值守
  基礎數據:統一管理系統基礎數據,自由添加,自由調用,支持配置權限,讓你的網(wǎng)站更靈活
  權限管理:按角色和用戶(hù)組劃分會(huì )員權限,對站內各欄目和功能靈活分配權限,方便多人使用
  話(huà)題管理:支持話(huà)題管理、話(huà)題分類(lèi)、支持內容推薦、關(guān)鍵詞搜索內容和推送話(huà)題等功能
  模板標簽:OOP思想,調用簡(jiǎn)潔明了,標簽形式靈活,支持動(dòng)態(tài)標簽,支持多層嵌套;全站支持動(dòng)靜態(tài)切換
  數據采集:靈活設置各種采集規則和參數,可設計自動(dòng)任務(wù)計劃采集,可裁剪采集圖片加水,支持采集內容&lt; @關(guān)鍵詞替換
  網(wǎng)頁(yè)防篡改:對網(wǎng)站生成的頁(yè)面進(jìn)行保護,遇到非法篡改時(shí)自動(dòng)糾正,讓您再也不用擔心網(wǎng)頁(yè)被掛了。
  通行證:可以通過(guò)外服系統實(shí)現會(huì )員準入,內置國內主流論壇或其他系統準入模塊,讓您的會(huì )員一站通行。 查看全部

  采集內容管理平臺(可與外阜系統實(shí)行會(huì )員通行,內置國內主流論壇或其它系統的通行模塊)
  SXcms是一個(gè)基于平臺的網(wǎng)站內容管理系統,默認支持SQLServer數據庫,可以擴展支持Access、MySQL、Oracle等數據庫。
  類(lèi)似軟件
  印記
  軟件地址
  后臺執行任務(wù):頁(yè)面生成、采集等任務(wù)在后臺執行,無(wú)需打開(kāi)網(wǎng)頁(yè)等待,節省您的工作時(shí)間
  原型模塊:自由擴展列字段和參數,滿(mǎn)足您的網(wǎng)站特殊定制,擴展您的個(gè)性化應用規劃任務(wù)
  它可以在固定的時(shí)間和周期內更新整個(gè)或部分列或其他任務(wù),從而實(shí)現網(wǎng)站無(wú)人值守
  基礎數據:統一管理系統基礎數據,自由添加,自由調用,支持配置權限,讓你的網(wǎng)站更靈活
  權限管理:按角色和用戶(hù)組劃分會(huì )員權限,對站內各欄目和功能靈活分配權限,方便多人使用
  話(huà)題管理:支持話(huà)題管理、話(huà)題分類(lèi)、支持內容推薦、關(guān)鍵詞搜索內容和推送話(huà)題等功能
  模板標簽:OOP思想,調用簡(jiǎn)潔明了,標簽形式靈活,支持動(dòng)態(tài)標簽,支持多層嵌套;全站支持動(dòng)靜態(tài)切換
  數據采集:靈活設置各種采集規則和參數,可設計自動(dòng)任務(wù)計劃采集,可裁剪采集圖片加水,支持采集內容&lt; @關(guān)鍵詞替換
  網(wǎng)頁(yè)防篡改:對網(wǎng)站生成的頁(yè)面進(jìn)行保護,遇到非法篡改時(shí)自動(dòng)糾正,讓您再也不用擔心網(wǎng)頁(yè)被掛了。
  通行證:可以通過(guò)外服系統實(shí)現會(huì )員準入,內置國內主流論壇或其他系統準入模塊,讓您的會(huì )員一站通行。

采集內容管理平臺( Excel模板導入支持統一的模板化配置,幫你解決 )

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 169 次瀏覽 ? 2022-01-28 06:10 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(
Excel模板導入支持統一的模板化配置,幫你解決
)
  Smartbi:統一Excel模板配置,讓批量數據采集補充記錄簡(jiǎn)單高效!
  
  Smartbi2022-01-26
  企業(yè)的數據源多種多樣,有的需要一線(xiàn)員工采集實(shí)時(shí)存儲在Excel文件中,然后由技術(shù)人員通過(guò)批量補充記錄上傳到業(yè)務(wù)數據庫中,供后續數據分析。
  比如某行的業(yè)務(wù)員采集時(shí)不時(shí)填寫(xiě)客戶(hù)的公司名稱(chēng)、客戶(hù)代碼、地區、內部交易等基本客戶(hù)信息,然后依靠IT人員填寫(xiě)上傳到業(yè)務(wù)數據庫。這些采集對補充記錄和補充記錄的要求并不復雜,但在實(shí)際操作中可能會(huì )遇到補充記錄不及時(shí)、數據不完整等問(wèn)題,給相關(guān)數據采集人員帶來(lái)麻煩,技術(shù)人員及其數據分析師。
  
  
  
  針對以上問(wèn)題,Smartbi提供批量數據采集功能——Excel模板導入幫你解決!允許數據采集補充人員通過(guò)統一的模板配置,一鍵批量導入Excel文件中的數據,并補充錄入數據庫。既減輕了開(kāi)發(fā)人員的工作量,又滿(mǎn)足了業(yè)務(wù)人員對數據采集的需求,讓批量導入Excel數據變得簡(jiǎn)單高效。
  我們來(lái)看看這個(gè)功能是如何滿(mǎn)足用戶(hù)需求的:
  1、模板配置
  Excel模板導入支持統一模板化配置。技術(shù)人員首先通過(guò)可視化操作實(shí)現Excel模板與數據庫表的映射關(guān)系,支持綁定列、驗證規則設置、數據插入和更新選擇等,并上傳采集Excel模板文件進(jìn)行補充數據,讓業(yè)務(wù)人員可以下載并填寫(xiě)數據。
  
  2、支持綁定形式
  Excel 導入模板支持綁定到電子表格。通過(guò)綁定表格,可以導入報表數據,可以導入固定值、系統值、參數值等,還可以實(shí)現動(dòng)態(tài)數據更新導入。
  例如,用戶(hù)要下載的補充記錄模板已經(jīng)收錄了一些填寫(xiě)好的數據(如公司代碼、公司名稱(chēng)、客戶(hù)代碼、業(yè)務(wù)分類(lèi)等),這部分現有數據可能會(huì )動(dòng)態(tài)變化。如果切換不同的業(yè)務(wù)分類(lèi)參數,下載的數據是不同的。實(shí)際上,用戶(hù)只需要根據已有數據填寫(xiě)“線(xiàn)路類(lèi)型”和“是否交易”字段的數據即可。
  這時(shí)候我們可以在配置模板的時(shí)候選擇創(chuàng )建一個(gè)電子表格作為Excel模板,這樣在下載模板的時(shí)候就可以選擇報表的參數,下載不同的數據模板。
  
  3、統一管理
  管理員統一配置和管理Excel模板,并可以通過(guò)資源授權將導入模板授權給相關(guān)用戶(hù)。只有有權限的用戶(hù)才能進(jìn)行導入操作,方便用戶(hù)填寫(xiě)導入。
  
  4、一鍵導入
  技術(shù)人員配置模板并授權給填充人員后,填充人員可以下載模板和采集數據。當數據采集完成后,可以點(diǎn)擊上傳,完成數據補錄操作。簡(jiǎn)單的。
  
  導入成功或失敗都有明確的提示。如果導入失敗,用戶(hù)可以下載異常數據,查看具體數據和導入失敗的原因。
  5、不錯的擴展
  Smartbi的Excel模板導入功能支持擴展接口,可以幫助用戶(hù)通過(guò)Java類(lèi)實(shí)現自定義數據處理需求或規則驗證需求。
  在實(shí)際的補錄操作中,客戶(hù)也可能有定制化的數據處理或規則驗證需求,比如判斷兩個(gè)指標的值是否相等。如果指標不相等,則驗證失敗,如果有相關(guān)提示信息,可以通過(guò)自定義規則驗證類(lèi)來(lái)實(shí)現這個(gè)需求。
   查看全部

  采集內容管理平臺(
Excel模板導入支持統一的模板化配置,幫你解決
)
  Smartbi:統一Excel模板配置,讓批量數據采集補充記錄簡(jiǎn)單高效!
  
  Smartbi2022-01-26
  企業(yè)的數據源多種多樣,有的需要一線(xiàn)員工采集實(shí)時(shí)存儲在Excel文件中,然后由技術(shù)人員通過(guò)批量補充記錄上傳到業(yè)務(wù)數據庫中,供后續數據分析。
  比如某行的業(yè)務(wù)員采集時(shí)不時(shí)填寫(xiě)客戶(hù)的公司名稱(chēng)、客戶(hù)代碼、地區、內部交易等基本客戶(hù)信息,然后依靠IT人員填寫(xiě)上傳到業(yè)務(wù)數據庫。這些采集對補充記錄和補充記錄的要求并不復雜,但在實(shí)際操作中可能會(huì )遇到補充記錄不及時(shí)、數據不完整等問(wèn)題,給相關(guān)數據采集人員帶來(lái)麻煩,技術(shù)人員及其數據分析師。
  
  
  
  針對以上問(wèn)題,Smartbi提供批量數據采集功能——Excel模板導入幫你解決!允許數據采集補充人員通過(guò)統一的模板配置,一鍵批量導入Excel文件中的數據,并補充錄入數據庫。既減輕了開(kāi)發(fā)人員的工作量,又滿(mǎn)足了業(yè)務(wù)人員對數據采集的需求,讓批量導入Excel數據變得簡(jiǎn)單高效。
  我們來(lái)看看這個(gè)功能是如何滿(mǎn)足用戶(hù)需求的:
  1、模板配置
  Excel模板導入支持統一模板化配置。技術(shù)人員首先通過(guò)可視化操作實(shí)現Excel模板與數據庫表的映射關(guān)系,支持綁定列、驗證規則設置、數據插入和更新選擇等,并上傳采集Excel模板文件進(jìn)行補充數據,讓業(yè)務(wù)人員可以下載并填寫(xiě)數據。
  
  2、支持綁定形式
  Excel 導入模板支持綁定到電子表格。通過(guò)綁定表格,可以導入報表數據,可以導入固定值、系統值、參數值等,還可以實(shí)現動(dòng)態(tài)數據更新導入。
  例如,用戶(hù)要下載的補充記錄模板已經(jīng)收錄了一些填寫(xiě)好的數據(如公司代碼、公司名稱(chēng)、客戶(hù)代碼、業(yè)務(wù)分類(lèi)等),這部分現有數據可能會(huì )動(dòng)態(tài)變化。如果切換不同的業(yè)務(wù)分類(lèi)參數,下載的數據是不同的。實(shí)際上,用戶(hù)只需要根據已有數據填寫(xiě)“線(xiàn)路類(lèi)型”和“是否交易”字段的數據即可。
  這時(shí)候我們可以在配置模板的時(shí)候選擇創(chuàng )建一個(gè)電子表格作為Excel模板,這樣在下載模板的時(shí)候就可以選擇報表的參數,下載不同的數據模板。
  
  3、統一管理
  管理員統一配置和管理Excel模板,并可以通過(guò)資源授權將導入模板授權給相關(guān)用戶(hù)。只有有權限的用戶(hù)才能進(jìn)行導入操作,方便用戶(hù)填寫(xiě)導入。
  
  4、一鍵導入
  技術(shù)人員配置模板并授權給填充人員后,填充人員可以下載模板和采集數據。當數據采集完成后,可以點(diǎn)擊上傳,完成數據補錄操作。簡(jiǎn)單的。
  
  導入成功或失敗都有明確的提示。如果導入失敗,用戶(hù)可以下載異常數據,查看具體數據和導入失敗的原因。
  5、不錯的擴展
  Smartbi的Excel模板導入功能支持擴展接口,可以幫助用戶(hù)通過(guò)Java類(lèi)實(shí)現自定義數據處理需求或規則驗證需求。
  在實(shí)際的補錄操作中,客戶(hù)也可能有定制化的數據處理或規則驗證需求,比如判斷兩個(gè)指標的值是否相等。如果指標不相等,則驗證失敗,如果有相關(guān)提示信息,可以通過(guò)自定義規則驗證類(lèi)來(lái)實(shí)現這個(gè)需求。
  

采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 125 次瀏覽 ? 2022-01-23 20:04 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)
  采集內容管理平臺,國內領(lǐng)先的pc+app采集服務(wù)平臺云采。這是在網(wǎng)絡(luò )信息大爆炸,注意力捉摸不透的今天,利用互聯(lián)網(wǎng)的云技術(shù),結合移動(dòng)端,輕松采集信息。
  這一段時(shí)間在業(yè)余學(xué)習django,簡(jiǎn)單總結一下學(xué)習路線(xiàn)吧:采集主要分為圖片采集、視頻采集、音頻采集,其中圖片采集一般在pc端,也就是坐在電腦前面,通過(guò)瀏覽器查看采集軟件的文件查看,視頻采集一般在手機上,也是用瀏覽器采集,音頻采集很麻煩,是自動(dòng)循環(huán)播放音頻,一般都是直接下載!至于什么樣的軟件,一般百度、阿里都會(huì )有相應的采集軟件,例如圖片采集的推薦url500、音頻采集推薦多采寶app,技術(shù)好的話(huà),你可以去學(xué)習下,都很容易上手!。
  中國采集網(wǎng)。不過(guò)這個(gè)我沒(méi)有用過(guò),
  接著(zhù)樓上的話(huà)題,補充一個(gè):中國采集網(wǎng)推薦原因1,國內數據質(zhì)量相對較高接著(zhù)討論每日站長(cháng)平臺需要的功能,數據質(zhì)量不容小覷。
  業(yè)余開(kāi)發(fā)還是php+mysql+java,php+mysql+redis+drupal比較適合業(yè)余開(kāi)發(fā),這樣不用引入一些費力不討好的框架和工具庫;如果大公司做采集,如果覺(jué)得性?xún)r(jià)比太低,可以考慮使用restful方式,比如headless+websocket+webrtc,nginx+cdn方式,nginx+c++方式,headless+gulp,postgresql+cgi,都是最佳選擇;php+mysql的采集是現在業(yè)余開(kāi)發(fā)中技術(shù)性很強的采集方案,不用引入一些麻煩的包、工具庫或第三方庫;除了laravel以外,目前業(yè)余開(kāi)發(fā)的有nutch+ci;。 查看全部

  采集內容管理平臺(業(yè)余開(kāi)發(fā)還是php+mysql+drupal+java哪個(gè)好?)
  采集內容管理平臺,國內領(lǐng)先的pc+app采集服務(wù)平臺云采。這是在網(wǎng)絡(luò )信息大爆炸,注意力捉摸不透的今天,利用互聯(lián)網(wǎng)的云技術(shù),結合移動(dòng)端,輕松采集信息。
  這一段時(shí)間在業(yè)余學(xué)習django,簡(jiǎn)單總結一下學(xué)習路線(xiàn)吧:采集主要分為圖片采集、視頻采集、音頻采集,其中圖片采集一般在pc端,也就是坐在電腦前面,通過(guò)瀏覽器查看采集軟件的文件查看,視頻采集一般在手機上,也是用瀏覽器采集,音頻采集很麻煩,是自動(dòng)循環(huán)播放音頻,一般都是直接下載!至于什么樣的軟件,一般百度、阿里都會(huì )有相應的采集軟件,例如圖片采集的推薦url500、音頻采集推薦多采寶app,技術(shù)好的話(huà),你可以去學(xué)習下,都很容易上手!。
  中國采集網(wǎng)。不過(guò)這個(gè)我沒(méi)有用過(guò),
  接著(zhù)樓上的話(huà)題,補充一個(gè):中國采集網(wǎng)推薦原因1,國內數據質(zhì)量相對較高接著(zhù)討論每日站長(cháng)平臺需要的功能,數據質(zhì)量不容小覷。
  業(yè)余開(kāi)發(fā)還是php+mysql+java,php+mysql+redis+drupal比較適合業(yè)余開(kāi)發(fā),這樣不用引入一些費力不討好的框架和工具庫;如果大公司做采集,如果覺(jué)得性?xún)r(jià)比太低,可以考慮使用restful方式,比如headless+websocket+webrtc,nginx+cdn方式,nginx+c++方式,headless+gulp,postgresql+cgi,都是最佳選擇;php+mysql的采集是現在業(yè)余開(kāi)發(fā)中技術(shù)性很強的采集方案,不用引入一些麻煩的包、工具庫或第三方庫;除了laravel以外,目前業(yè)余開(kāi)發(fā)的有nutch+ci;。

采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)

采集交流 ? 優(yōu)采云 發(fā)表了文章 ? 0 個(gè)評論 ? 134 次瀏覽 ? 2022-01-23 03:00 ? 來(lái)自相關(guān)話(huà)題

  采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)
  采集內容管理平臺是云表格未來(lái)規劃的重點(diǎn),能夠實(shí)現數據采集和表格聚合、流程管理、人事管理、報表分析等多方面的功能,核心業(yè)務(wù)是采集內容和數據有效性,對數據的格式和內容精準的控制是數據分析的關(guān)鍵。其中,數據有效性用于用戶(hù)在數據規范有誤時(shí)提供工具幫助用戶(hù)修正和識別數據,是一種可以靈活部署的功能。市面上一些通用的內容管理產(chǎn)品(如京東、、百度經(jīng)驗)都能實(shí)現上述功能。
  而今天要介紹的優(yōu)圖是優(yōu)圖動(dòng)態(tài)采集內容管理系統,在這個(gè)系統中能夠查看采集的用戶(hù)歷史、信息新增和刪除、已采集信息、待采集數據、已搜索結果、已簽名以及評論等。系統涵蓋了表格和數據庫,對于快速采集信息有不錯的幫助,其目標用戶(hù)就是為了提高工作效率,但問(wèn)題是數據采集時(shí)的準確度是否保證,這將成為用戶(hù)付費的因素之一。
  優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心就是提高數據準確度,同時(shí)隨著(zhù)內容的增加相應的時(shí)間復雜度也會(huì )增加,所以?xún)?yōu)圖在出發(fā)點(diǎn)上就沒(méi)有考慮過(guò)犧牲準確度來(lái)提高收益。以用戶(hù)“中醫小吳先生”為例,根據京東手機通知信息,表格顯示“中醫小吳先生今天20點(diǎn)在某地就診,小吳先生近期曾去該醫院附近的某健康會(huì )所進(jìn)行xxx治療”,這就出現了時(shí)間無(wú)法確定的問(wèn)題,也就是說(shuō)一天之內,不可能有小吳先生的各種關(guān)聯(lián)信息能夠滿(mǎn)足這個(gè)需求。
  如何解決這個(gè)問(wèn)題呢??jì)?yōu)圖的思路就是對信息采集后保存的數據進(jìn)行統計分析,然后推送給用戶(hù)。那么應該怎么做呢?是將數據全部上傳到百度經(jīng)驗中?還是根據圖片確定下來(lái)?還是利用人工智能算法,在后端對信息進(jìn)行搜索呢?“中醫小吳先生”能夠看到京東與京東健康達成的醫療合作,我們無(wú)法得知京東經(jīng)營(yíng)信息,優(yōu)圖能夠想到的就是采集京東商品的信息,因為京東在線(xiàn)上銷(xiāo)售經(jīng)營(yíng)中可以對所有的商品進(jìn)行歸類(lèi),這樣也就從信息數據層面解決了小吳先生無(wú)法統計分析的問(wèn)題。
  其實(shí)用戶(hù)的需求可以從三個(gè)方面解決:一個(gè)是表格中過(guò)多或無(wú)效內容如何清理,一個(gè)是列表中無(wú)法有效分類(lèi),還有一個(gè)是信息數據的準確性。優(yōu)圖動(dòng)態(tài)采集內容管理系統針對上述功能都進(jìn)行了不錯的優(yōu)化,現階段能夠正常使用。歡迎大家關(guān)注優(yōu)圖動(dòng)態(tài)采集內容管理系統,了解更多優(yōu)圖系統更多信息。 查看全部

  采集內容管理平臺(優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心是什么?怎么做?)
  采集內容管理平臺是云表格未來(lái)規劃的重點(diǎn),能夠實(shí)現數據采集和表格聚合、流程管理、人事管理、報表分析等多方面的功能,核心業(yè)務(wù)是采集內容和數據有效性,對數據的格式和內容精準的控制是數據分析的關(guān)鍵。其中,數據有效性用于用戶(hù)在數據規范有誤時(shí)提供工具幫助用戶(hù)修正和識別數據,是一種可以靈活部署的功能。市面上一些通用的內容管理產(chǎn)品(如京東、、百度經(jīng)驗)都能實(shí)現上述功能。
  而今天要介紹的優(yōu)圖是優(yōu)圖動(dòng)態(tài)采集內容管理系統,在這個(gè)系統中能夠查看采集的用戶(hù)歷史、信息新增和刪除、已采集信息、待采集數據、已搜索結果、已簽名以及評論等。系統涵蓋了表格和數據庫,對于快速采集信息有不錯的幫助,其目標用戶(hù)就是為了提高工作效率,但問(wèn)題是數據采集時(shí)的準確度是否保證,這將成為用戶(hù)付費的因素之一。
  優(yōu)圖動(dòng)態(tài)采集內容管理系統的核心就是提高數據準確度,同時(shí)隨著(zhù)內容的增加相應的時(shí)間復雜度也會(huì )增加,所以?xún)?yōu)圖在出發(fā)點(diǎn)上就沒(méi)有考慮過(guò)犧牲準確度來(lái)提高收益。以用戶(hù)“中醫小吳先生”為例,根據京東手機通知信息,表格顯示“中醫小吳先生今天20點(diǎn)在某地就診,小吳先生近期曾去該醫院附近的某健康會(huì )所進(jìn)行xxx治療”,這就出現了時(shí)間無(wú)法確定的問(wèn)題,也就是說(shuō)一天之內,不可能有小吳先生的各種關(guān)聯(lián)信息能夠滿(mǎn)足這個(gè)需求。
  如何解決這個(gè)問(wèn)題呢??jì)?yōu)圖的思路就是對信息采集后保存的數據進(jìn)行統計分析,然后推送給用戶(hù)。那么應該怎么做呢?是將數據全部上傳到百度經(jīng)驗中?還是根據圖片確定下來(lái)?還是利用人工智能算法,在后端對信息進(jìn)行搜索呢?“中醫小吳先生”能夠看到京東與京東健康達成的醫療合作,我們無(wú)法得知京東經(jīng)營(yíng)信息,優(yōu)圖能夠想到的就是采集京東商品的信息,因為京東在線(xiàn)上銷(xiāo)售經(jīng)營(yíng)中可以對所有的商品進(jìn)行歸類(lèi),這樣也就從信息數據層面解決了小吳先生無(wú)法統計分析的問(wèn)題。
  其實(shí)用戶(hù)的需求可以從三個(gè)方面解決:一個(gè)是表格中過(guò)多或無(wú)效內容如何清理,一個(gè)是列表中無(wú)法有效分類(lèi),還有一個(gè)是信息數據的準確性。優(yōu)圖動(dòng)態(tài)采集內容管理系統針對上述功能都進(jìn)行了不錯的優(yōu)化,現階段能夠正常使用。歡迎大家關(guān)注優(yōu)圖動(dòng)態(tài)采集內容管理系統,了解更多優(yōu)圖系統更多信息。

官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

亚洲国产精品无码久久大片,亚洲AV无码乱码麻豆精品国产,亚洲品质自拍网站,少妇伦子伦精品无码STYLES,国产精久久久久久久