經(jīng)驗分享 :以互聯(lián)網(wǎng)行業(yè)為背景下的數據分析通識
優(yōu)采云 發(fā)布時(shí)間: 2022-06-24 23:41經(jīng)驗分享 :以互聯(lián)網(wǎng)行業(yè)為背景下的數據分析通識
前言
我們上節內容,給大家介紹了數據分析如何入門(mén)、數據分析的基本流程,相信大家對入門(mén)數據分析的一些要求和入門(mén)方法都有了相應的了解。在這里繼續探討,數據分析入門(mén)之后的一些事情,包括數據分析的進(jìn)階方法、數據分析的發(fā)展前景和優(yōu)勢。目的是給大家提供一個(gè)做數據分析工作未來(lái)的規劃的方向,同時(shí)對目前職業(yè)狀態(tài)也會(huì )有一個(gè)更全面的定位了。七
數據分析進(jìn)階
01
數據分析進(jìn)階的階段
在入門(mén)階段開(kāi)始時(shí),我們對數據分析基本流程有了一個(gè)概念的認識。那么,在進(jìn)階的階段,要做的事情很簡(jiǎn)單,那就是:完善數據分析流程的基本面理解、更加深入地學(xué)習數據分析工具。
我們來(lái)看一下數據分析進(jìn)階的階段:
第一階段:基本信息處理大部分情況下,公司的數據體系相對已經(jīng)比較成熟了,所有到你手上的數據都是相對比較干凈和統一了,這時(shí)候數據分析的主要工作就是各種數據的提取以及數據處理。這里面涉及到,整理并了解各種數據指標,搭建數據監控數據表格,包含日常數據監控表、渠道匯總表、銷(xiāo)售明細報表、新增用戶(hù)表等等,而使用的工具一般為Excel。而SQL在此階段可作為輔助工具,從數據庫提取和統計數據,然后導入Excel繼續做表格,在這個(gè)階段要突破的技能就是 :Excel的技巧和使用。下面簡(jiǎn)單介紹一下,在進(jìn)階階段,對于Excel的技巧應該要掌握到什么樣的水平?;竟δ芫筒槐亟榻B了,之前有一篇推文提及到,如果在推文里面的練習題你可以做到滿(mǎn)分,說(shuō)明你已經(jīng)基本合格了。(推文:Excel基礎知識,Excel功能篇,Excel函數篇)在常用函數上,你需要掌握如下的函數:
其他平時(shí)少用的函數,則大可不必花大量時(shí)間去研究,除非你立志要成為Excel表格大師。用的比較少的函數,在需要用的時(shí)候上網(wǎng)搜索相關(guān)資源即可,所以平時(shí)只需要掌握常用的這幾類(lèi)函數就足夠了。數據透視表的內容比較簡(jiǎn)單,跟BI工具的操作如出一轍:拖拉拽。將你想要透視的字段合理的進(jìn)行規整,并適當的設置透視表的格式,當然如果你想考慮設計一個(gè)指標駕駛艙,并使用控件對駕駛艙數據進(jìn)行更新,那么你還需要學(xué)習如何將透視表和控件參數進(jìn)行聯(lián)動(dòng)的內容?;緢D表的使用非常重要,除了要學(xué)會(huì )Excel里面常用圖表的創(chuàng )建方法,還需要學(xué)習如何用圖表來(lái)準確的表達你想傳達的信息。在圖表設計上,表達內容比圖表制作更重要,同時(shí)還要考慮基本的配色,來(lái)配合你傳達內容的主題。如果在這一塊想深入了解的話(huà),這里面就是可視化的內容了。Excel已經(jīng)是非常成熟的軟件,幾乎所有使用技巧你都可以各種書(shū)籍以及相關(guān)的網(wǎng)站里找到并操練起來(lái)。如果數據量不大,且數據以數值為主,處理簡(jiǎn)單的計算邏輯,Excel基本就夠用了。而當你需要更強大的一些功能,比如對多張數據表靈活切換、分組、聚合、索引、排序,并且結合各種函數的使用,或采用到復雜些的數據分析模型、統計方法,則可進(jìn)一步學(xué)習SQL以及學(xué)習Python的Pandas庫進(jìn)行更高階的表格處理。
第二階段:學(xué)會(huì )SQL獲取數據此階段,我們要知道如何去獲取數據,其中最常見(jiàn)的就是從關(guān)系型數據庫中取數,可以暫時(shí)不會(huì )R語(yǔ)言和Python,但是必須掌握SQL數據庫語(yǔ)言。大數據時(shí)代,數據正在呈指數級增長(cháng),面臨的數據量會(huì )大大增加,從GB,到TB,甚至到PB,非??捎^(guān)。因此,有著(zhù)固定行數限制的的Excel顯然無(wú)法滿(mǎn)足需求這種大容量數據的分析。因此,學(xué)習數據庫語(yǔ)言就顯得非常有必要了。SQL數據庫語(yǔ)言至少要掌握哪些內容呢:基本的增刪改查會(huì )了之后,還得學(xué)會(huì )高級一點(diǎn)的功能,例如:這時(shí)候就需要學(xué)習數據庫。理解數據庫和數據存儲結構,會(huì )一點(diǎn)增刪改查的數據庫操作,因此,SQL是數據分析的核心技能之一,在這個(gè)階段就是從Excel到SQL的數據處理效率進(jìn)一步進(jìn)階。我們經(jīng)常說(shuō)“學(xué)以致用”,“以用促學(xué)”,最好的學(xué)習方式就是練習,現在很多平臺都有提供練習SQL語(yǔ)言的地方,例如??途W(wǎng)、LeeCode網(wǎng)等等。經(jīng)常刷刷題,保持做代碼的感覺(jué),是有必要的。
第三階段:數據可視化展現數據分析所有的流程里面,數據可視化是發(fā)現數據和展示結果的重要一環(huán)。試想僅將數據分析結果以數字報告或數字表格的方式呈現在老板的辦公桌上,十年如一日,老板會(huì )有啥感想?
具備圖表可視化能力,更加直觀(guān)地展現分析結果,幫助管理層抓住數據本質(zhì),最好方式就是做出觀(guān)點(diǎn)清晰數據的PPT和報表給老板看??梢暬芰κ沁@個(gè)階段的數據分析人員必不可少的技能。在數據可視化展現時(shí),一般的工作場(chǎng)景中常見(jiàn)的就是Excel數據透視表功能,而且目前有WPS里有很多好的的可視化圖案可供大家選擇,還有目前現成的商業(yè)智能分析軟件,如power BI或Tableau等,這兩個(gè)工具都不要編程功底,實(shí)現起來(lái)簡(jiǎn)單,功能強大,BI商業(yè)軟件可以滿(mǎn)足你大部分的可視化需求,不過(guò)功能也會(huì )存在一些受限的場(chǎng)景。然而,Python語(yǔ)言在數據可視化方面也有很*敏*感*詞*,比如Pyecharts等,使用編程語(yǔ)言的好處是更靈活、可以更好地適應特殊的需求。推薦書(shū)籍:《用圖表說(shuō)話(huà)》-麥肯錫
第四階段:數據貼合業(yè)務(wù)進(jìn)行分析從按月匯總的數據明細,各種業(yè)務(wù)信息、驅動(dòng)因素、環(huán)境變量、變化路徑,經(jīng)過(guò)層層的匯總篩選處理,可能已經(jīng)遺失了大量信息和數據,導致數據分析有所局限,很難對業(yè)務(wù)決策起到支持作用。此階段,貼合業(yè)務(wù)數據綜合的分析,通過(guò)對業(yè)務(wù)的了解 ,基于業(yè)務(wù)的邏輯對數據進(jìn)行分析,找到數據指標變動(dòng)原因,通過(guò)發(fā)現業(yè)務(wù)問(wèn)題點(diǎn)。這個(gè)階段需要進(jìn)行高階的數據處理、加工和分析,通過(guò)Sql或者Python讀取數據庫的龐大數據,也是數據分析人員的必經(jīng)之路。你會(huì )真正從數據的角度開(kāi)始理解業(yè)務(wù),洞察一切細節深究業(yè)務(wù),也是在這個(gè)階段真正的數據分析進(jìn)階。
第五階段:數據驅動(dòng)業(yè)務(wù)在數據的領(lǐng)域里,整理了無(wú)數的數據報表,梳理了很多遍的業(yè)務(wù)邏輯,最后數據分析人員開(kāi)始進(jìn)入這個(gè)階段:如何高效能的優(yōu)化數據指標監控體系,讓數據報表之間的井然有序,讓數據分析更簡(jiǎn)單和靈活,讓決策迅速而優(yōu)化?能結合行業(yè)背景,利用數據挖掘工具,建置數據挖掘模型,發(fā)掘規律、商業(yè)價(jià)值、降本提效?支持優(yōu)化業(yè)務(wù)決策、發(fā)掘規律、商業(yè)價(jià)值、降本提效?這不就是數據的分析的價(jià)值所在么?因此 ,此階段數據分析人員就需要建立復雜的多維的決策建模,使其更有體系,真正的實(shí)現數據驅動(dòng)業(yè)務(wù)。就是將二維的平面數據報表,進(jìn)階到一個(gè)個(gè)立方體的多維宇宙,多方位的實(shí)現數據驅動(dòng)業(yè)務(wù)增長(cháng),高效能的解決實(shí)際業(yè)務(wù)場(chǎng)景中遇到的大部分復雜工作。比如上千家門(mén)店的銷(xiāo)售數據報表合并等。
小結
總之,在數據分析進(jìn)階的過(guò)程中,有兩個(gè)方面的能力:一是思維能力,包含財務(wù)思維、管理思維、業(yè)務(wù)思維、商業(yè)思維等;二是技術(shù)能力,主要是軟件使用能力和數據展示能力等??梢哉f(shuō),分析工具是數據分析必備的硬件模塊,它就像一雙手。而分析思維,是數據分析必備的軟件模塊,它就像一個(gè)大腦。這兩個(gè)方面的能力一直穿插在數據分析進(jìn)階的過(guò)程中,在不同的階段不斷的更新迭代、不斷的提升。
02
思維與數據分析
所謂的數據思維,其目標是讓數據傳達出真正的信息,且呈現出畫(huà)面感,而不是一堆堆冰冷的數據指標。就像簡(jiǎn)歷或者工作總結中,要體現活動(dòng)營(yíng)銷(xiāo)轉化率提升5%,創(chuàng )建企業(yè)率提升5%,會(huì )員業(yè)績(jì)提升8%一樣。數據分析思維是通過(guò)各種方法收集數據,了解需求,然后改進(jìn)決策,不斷迭代,降本提效。在工作和生活中,我們應該通過(guò)不同的場(chǎng)景,來(lái)不斷培養數據思維習慣。如在工作中:?在廣告投放時(shí),嘗試去估算廣告的受眾群數量大小,渠道數量、成本和效果回收情況,想辦法去拆解出各種影響因素、預期效果、投入成本等信息。?在優(yōu)化產(chǎn)品時(shí),去梳理其商業(yè)模式、面對的用戶(hù)群體、群體的使用場(chǎng)景,以及可能設置的付費點(diǎn)并去驗證,同時(shí)想到可改進(jìn)的價(jià)值點(diǎn),并觀(guān)察后續運營(yíng)動(dòng)作是否驗證了改進(jìn)點(diǎn)。?在整理回訪(fǎng)數據時(shí),能通過(guò)線(xiàn)索來(lái)源,通話(huà)總次數,通話(huà)有效次數&時(shí)長(cháng),線(xiàn)索意向級別,銷(xiāo)售司齡等數據維度來(lái)判斷這組客戶(hù)的意向度,縮短成單周期?!ぁぁぁぁぁぁぴ谏钪校?觀(guān)察并思考為什么滴滴打車(chē)你的價(jià)格高?可能你周?chē)熊?chē)用戶(hù)多而司機少,也可能"其他原因"。?觀(guān)察并思考為什么微信訂閱號文章改版后,有了點(diǎn)贊,還要增加在看?微信想加深用戶(hù)粘性,讓你看到更多朋友的世界,也讓微信文章得到更多曝光。?觀(guān)察并思考為什么每個(gè)超市都鼓勵辦會(huì )員卡?因為要留住你,增加你選擇去他們消費的機會(huì ),減少去競爭對手消費的機會(huì )?!ぁぁぁぁぁぁ?/p>
小結
以上是我們可以在工作和生活中需要培養數據思維習慣的思考場(chǎng)景,當然,不同場(chǎng)景產(chǎn)生差異化的行為,而數據分析思維讓我們從數據上觀(guān)察到這些差異,然而在實(shí)際工作中的前提是,我們要熟悉自己的業(yè)務(wù)流程以及業(yè)務(wù)指標等,我們在培養數據思維的同時(shí)數據敏感度會(huì )不斷提升。
03
工具與數據分析
數據分析的工具市面上也是有很多的,也在不斷進(jìn)化發(fā)展的,這時(shí)我們就需要根據公司業(yè)務(wù)情況進(jìn)行選擇。比如做市場(chǎng)研究、競對分析經(jīng)常會(huì )使用Python進(jìn)行外部數據的抓取,統計分析領(lǐng)域常用到SPSS,以及調用地圖開(kāi)放平臺進(jìn)行地圖可視化繪制。對于數據分析進(jìn)階之路上,在不同階段應用的工具也有所不同,Excel+SQL這2個(gè)工具在上述篇章作為入門(mén)的數據分析工具提過(guò),這里就不展開(kāi)介紹了,這里在進(jìn)階方面推薦一下Python+可視化工具。█Python大多數人可能是從0開(kāi)始,從未接觸過(guò)編程,因而入門(mén)確實(shí)是有一定難度的。而更為關(guān)鍵的原因是,從數據分析進(jìn)階的過(guò)程中,從技能上來(lái)看,Python使用場(chǎng)景豐富,助益頗多,又語(yǔ)言簡(jiǎn)潔,適合新手學(xué)習。Python是一種面向對象、解釋型計算機程序設計語(yǔ)言。Python語(yǔ)法簡(jiǎn)潔而清晰,具有豐富和強大的類(lèi)庫。它常被昵稱(chēng)為膠水語(yǔ)言,能夠把用其他語(yǔ)言制作的各種*敏*感*詞*做數據分析的商業(yè)智能軟件,先用PowerQuery處理和清洗數據,再用PowerPivot建模,最后用Power BI的圖表庫作圖。其特點(diǎn):與Excel無(wú)縫對接,創(chuàng )建個(gè)性化的數據看板,對于常用Excel的來(lái)說(shuō)學(xué)習上手也相對容易。
小結
除以上提到的Excel+SQL+可視化+Python等數據分析工具外,還有很多其他的工具,如SPSS、R語(yǔ)言等,大家在學(xué)習時(shí),可以根據自己的實(shí)際需要來(lái)學(xué)習,不必要花費大量時(shí)間,做到樣樣精通。這些工具主要是能夠幫助我們在短時(shí)間內完成復雜的數據分析計算過(guò)程,輸出準確的數據分析結果,提高工作效率的??傊?,在數據分析工作中,分析工具和分析方法是密不可分的,科學(xué)的方法結合高效的分析工具使用,才能提高分析效率和質(zhì)量。
04
數據進(jìn)階的知識點(diǎn)和書(shū)籍推薦(僅供參考)
1)網(wǎng)絡(luò )爬蟲(chóng)、SPSS、SAS、R語(yǔ)言等的學(xué)習:《SPSS統計分析基礎教程》、《問(wèn)卷數據分析-破解SPSS的六類(lèi)分析思路》、《R語(yǔ)言實(shí)戰》等書(shū)籍。2)數據挖掘算法得到學(xué)習:這部分相對來(lái)說(shuō)還是比較難的,但是在工作中會(huì )去深化理解和學(xué)習,可以粗略的看看,等工作中遇到的時(shí)候再去針對性學(xué)習。學(xué)習資源有:經(jīng)典的 《統計學(xué)習方法》,主講分類(lèi)算法,偏理論推導《機器學(xué)習實(shí)戰》《機器學(xué)習》等書(shū)籍。3)數學(xué)知識的學(xué)習:概率論基礎、獨立事件、條件概率、全概率公式以及貝葉斯定律,有《概率導論》《線(xiàn)性代數》《概率論與數理統計》等書(shū)籍?!ぁぁぁぁぁぁぐ?/p>
數據分析存在的挑戰以及發(fā)展前景
01
數據分析挑戰在哪里?
?入門(mén)容易,進(jìn)階難
“數據分析”越來(lái)越成為各個(gè)職業(yè)的必備的基本技能,各個(gè)職業(yè)上的從業(yè)人員都會(huì )開(kāi)始學(xué)習數據分析,如運營(yíng)、產(chǎn)品、技術(shù)、人力、財務(wù)都需要一些數據分析的思維和技能,因此,不只是從事數據分析領(lǐng)域的人員需要掌握的,別的職能也需要懂些基本的,尤其在互聯(lián)網(wǎng)行業(yè),要了解常用的基本分析框架和思維,簡(jiǎn)單的做個(gè)報表,讀懂 A/B test,能做簡(jiǎn)單的決定等等。但是呢,在數據分析這個(gè)領(lǐng)域,進(jìn)階非常難,在方法論以及思維方面,因為實(shí)際操作中有很多坑,而這些坑,通過(guò)在書(shū)本里是很難找到的,即使有也是非常零散。在技能方面呢,大部分人又從未接觸過(guò)編程,因此,進(jìn)階的過(guò)程會(huì )有一定難度的。?不能有效推動(dòng)業(yè)務(wù),價(jià)值產(chǎn)出弱互聯(lián)網(wǎng)行業(yè)是一個(gè)構建在規模經(jīng)濟之上的、競爭相當激烈的行業(yè),產(chǎn)品更新迭代速度快。只有快速迭代產(chǎn)品,更好、更快地滿(mǎn)足用戶(hù)需求,吸引足夠多的用戶(hù)關(guān)注與使用,獲得快速增長(cháng),才能拿到融資、才能獲得較好的*敏*感*詞*流,否則很難生存下去。目前2C行業(yè)已經(jīng)到了增長(cháng)的天花板,競爭只會(huì )愈演愈烈。企業(yè)會(huì )更加在意數據分析的價(jià)值產(chǎn)出,希望以數據驅動(dòng)的形式快速迭代產(chǎn)品,產(chǎn)生更多的用戶(hù)增長(cháng)和*敏*感*詞*流。但是呢,業(yè)務(wù)發(fā)展太快,導致人手不足,數據分析人員沒(méi)法深入了解業(yè)務(wù),沒(méi)有貼合業(yè)務(wù)的數據分析產(chǎn)出的結果,并不能真正的推動(dòng)業(yè)務(wù)增長(cháng),也不能很好的判斷哪些需求的優(yōu)先級,可能導致避重就輕。
進(jìn)而,缺乏數據分析落地的實(shí)例,進(jìn)而循環(huán)往復。當然,這里面影響因素是多種多樣,而且互相影響,就不一一展開(kāi)了。?存在感不強,技能要求會(huì )越來(lái)越高在很多時(shí)候不少公司又缺乏充足的落地的實(shí)例,于是行業(yè)整體看來(lái),數據分析人員即不如技術(shù)類(lèi)工種難度高、需求大,又不如產(chǎn)品類(lèi)工種貼近業(yè)務(wù),因此,其主要的工作是支撐業(yè)務(wù)部門(mén),為業(yè)務(wù)部門(mén)提供各種數據用于業(yè)務(wù)決策。但業(yè)務(wù)方往往不清楚業(yè)務(wù)的真實(shí)需求,數據分析人員更加不太關(guān)注業(yè)務(wù),淪為一個(gè)取數機器或者表哥等。最終,對工作的熱情一定不會(huì )高,也會(huì )失去一定存在感。但是呢,隨著(zhù)科學(xué)技術(shù)的進(jìn)步、5G技術(shù)的成熟,整個(gè)互聯(lián)網(wǎng)行業(yè)上將會(huì )產(chǎn)生越來(lái)越多的數據,這些數據呈現出越來(lái)越非結構化的趨勢,數據種類(lèi)也越來(lái)越多樣化,這些數據包括文本、圖片、視頻、音頻、網(wǎng)頁(yè)、社交關(guān)系等多種數據類(lèi)型,其處理方式也會(huì )更加復雜。因此,不光要懂SQL、Python等,未來(lái)的數據分析人員可能還要精通(至少要了解原理、會(huì )用工具)很多其他的數據處理技術(shù)。這無(wú)形給數據分析人員提出了更高的要求,工作也會(huì )更加有挑戰。
02
數據分析發(fā)展前景
在大數據和5G技術(shù)逐漸成為趨勢的時(shí)代背景下,“數據”是越來(lái)越常見(jiàn),如社交網(wǎng)絡(luò )、消費信息、旅游記錄……企業(yè)層面的銷(xiāo)售數據、運營(yíng)數據、產(chǎn)品數據、活動(dòng)數據……如何快速精準的對這些數據進(jìn)行處理?如何從海量數據中挖掘別人看不見(jiàn)的價(jià)值?如何利用這些數據來(lái)做精準營(yíng)銷(xiāo)投放、優(yōu)化產(chǎn)品、用戶(hù)調研、支撐決策?因此,運營(yíng)、產(chǎn)品、市場(chǎng)、營(yíng)銷(xiāo)等工作崗位中數據分析是必不可少的一項技能!數據分析可以將數據的價(jià)值最大化!而從各大招聘網(wǎng)站也可以看出來(lái),在薪資方面也是相當可觀(guān)的!并且現在各個(gè)互聯(lián)網(wǎng)的崗位都需要數據分析技能!由此可見(jiàn),在未來(lái)互聯(lián)網(wǎng)職場(chǎng)中,“數據分析”技能無(wú)疑成為的標配!就數據分析前景而言,其發(fā)展路徑無(wú)非是兩條:要么在公司內部做數據分析,偏前端,重在業(yè)務(wù)分析,用數據分析賦能業(yè)務(wù)發(fā)展。要么數據挖掘方向,偏后端,技術(shù)能力要求更高一些,但對業(yè)務(wù)的理解是基礎。而做數據分析更應該考慮如何用數據創(chuàng )造價(jià)值,如果你沒(méi)有用數據創(chuàng )造價(jià)值的能力,那么就只能等著(zhù)被數據淹沒(méi),淪為一個(gè)取數的或者做報表的機器而已,也就早早的到達職業(yè)的天花板。這往往體現在數據價(jià)值的層面上,越往數據應用層靠攏,對數據產(chǎn)生價(jià)值的要求就越高,從事數據分析領(lǐng)域的人要常常自省是否有更好的商業(yè)意識、數據思維、業(yè)務(wù)理解能力、數據敏感度等,畢竟在公司層面,沒(méi)人關(guān)心你是否比某個(gè)指標提高了一個(gè)百分點(diǎn),公司關(guān)心的是你提高了這一個(gè)百分點(diǎn)之后,對公司產(chǎn)生的價(jià)值是什么。那么,你就需要成為具備商業(yè)意識、數據思維、業(yè)務(wù)理解能力、數據敏感度等的高價(jià)值的數據人員,所以多多學(xué)習吧,別太約束自己,故步自封,多在行業(yè)領(lǐng)域內交流。(注:本文由木兮、紅星共同完成。)轉自:木木自由 公眾號;
END








