如何自學數據分析方法介紹

越來越多的管理者意識到數據分析對公司的運營以及經濟的發展有着重要意義,但卻不知該怎麼自學好。下面本站小編整理了自學數據分析的方法,希望對你有所幫助!

如何自學數據分析方法介紹

  如何自學數據分析

想要成爲數據分析師,最快需要七週?七週信不信?

這是一份數據分析師的入門指南,它包含七週的內容,Excel、數據可視化、數據分析思維、數據庫、統計學、業務、以及Python。

每一週的內容,都有兩到三篇文章細緻講解,幫助新人們快速掌握。這七週的內容剛好涵蓋了一位數據分析師需要掌握的基礎體系,也是一位新人從零邁入數據大門的知識手冊。

第一週:Excel

每一位數據分析師都脫離不開Excel。

它是日常工作中最常用的工具,如果不考慮性能和數據量,它可以應付絕大部分分析工作。雖然現在機器學習滿地走,Excel依舊是無可爭議的第一工具。

Excel的學習分爲兩個部分。

掌握各類功能強大的函數,函數是一種負責輸入和輸出的神祕盒子。把各類數據輸入,經過計算和轉換輸出我們想要的結果。

在SQL,Python以及R中,函數依舊是主角。掌握Excel的函數有助於後續的學習,因爲你幾乎在編程中能找到名字一樣或者相近的函數。

在「數據分析:常見的Excel函數全部涵蓋在這裏了」中,介紹了常用的Excel函數。

清洗處理類:trim、concatenate、replace、substitute、left/right/mid、len/lenb、find、search、text

關聯匹配類:lookup、vlookup、index、match、row、column、offset

邏輯運算類:if、and、or、is系列

計算統計類:sum/sumif/sumifs、sumproduct、count/countif/countifs、max、min、rank、rand/randbetween、averagea、quartile、stdev、substotal、int/round

時間序列類:year、month、weekday、weeknum、day、date、now、today、datedif

搜索能力是掌握Excel的不二竅門,工作中的任何問題都是可以找到答案。

第二部分是Excel中的工具。

在「數據分析:Excel技巧大揭祕」教程,介紹了Excel最具性價比的幾個技巧。包括數據透視表、格式轉換、數組、條件格式、自定義下拉菜單等。正是這些工具,才讓Excel在分析領域經久不衰。

在大數據量的處理上,微軟提供了Power系列,它和Excel嵌套,能應付百萬級別的數據處理,彌補了Excel的不足。

Excel需要反覆練習,實戰教程「數據分析:手把手教你Excel實戰」,它通過網絡上抓取的數據分析師薪資數據作爲練習,總結各類函數的使用。

除了上述要點,下面是附加的知識點,鋪平數據分析師以後的道路。

瞭解單元格格式,數據分析師會和各種數據類型打交道,包括各類timestamp,date,string,int,bigint,char,factor,float等。

瞭解數組,以及相關應用(excel的數組挺難用),Python和R也會涉及到 list,是核心概念之一。

瞭解函數,深入理解各種參數的作用。它會在學習Python中幫助到你。

瞭解中文編碼,UTF8、GBK、ASCII,這是數據分析師的坑點之一。

第二週:數據可視化

數據分析界有一句經典名言,字不如表,表不如圖。

數據可視化是分析的常用技巧之一,不少數據分析師的工作就是通過圖表觀察和監控數據。首先了解常用的圖表:

Excel的圖表可以100%繪製上面的圖形,但這只是基礎。

在「數據可視化:你想知道的經典圖表全在這」中介紹了各類數據分析的經典圖表,除了趨勢圖、直方圖,還包括桑基圖、空間圖、熱力圖等額外的類型。

數據可視化不是圖表的美化,而是呈現數據的邏輯之美,是揭示數據的內在關聯。瞭解圖表的維度和適用場景,比好看更重要。比如桑吉圖就是我一直推崇的圖表,它並不知名,但是它能清晰的揭露數據內在狀態的變化和流向。案例是用戶活躍狀態的趨勢。

Excel的圖表操作很傻瓜化,其依舊能打造出一份功能強大的可視化報表。「數據可視化:教你打造升職加薪的報表」教給大家常用的Excel繪圖技巧,包括配色選取,無用元素的剔除、輔助線的設立、複合圖表等方法。

Excel圖表的創造力是由人決定的,對數據的理解,觀察和認知,以及對可視化的應用,這是一條很長的道路。

圖表是單一的,當面板上繪製了多張圖表,並且互相間有關聯,我們常稱之爲Dashboard儀表盤。

上圖就是用分析師薪資數據爲數據源繪製的Dashboard,比單元格直觀不少。我們常常把繪製這類Dashboard的工具叫做BI。

BI(商業智能)主要有兩種用途。一種是利用BI製作自動化報表,數據類工作每天都會接觸大量數據,並且需要整理彙總,這是一塊很大的工作量。這部分工作完全可以交給BI自動化完成,從數據規整、建模到下載。

另外一種是使用其可視化功能進行分析,它提供比Excel更豐富的交互功能,操作簡單,而且美觀,如果大家每天作圖需要兩小時,BI能縮短大半。

在「數據可視化:手把手打造BI」教程中,以微軟的PowerBI舉例,教大家如何讀取數據,規整和清洗數據,繪製圖表以及建立Dashboard。最後的成果就是上文列舉的分析師案例。

BI還有幾個核心概念,包括OLAP,數據的聯動,鑽取,切片等,都是多維分析的技巧,也是分析的核心方法之一。

後續的進階可視化,將和編程配合。因爲編程能夠提供更高效率和靈活的應用。而BI也是技術方向的工具,瞭解技術知識對應用大有幫助。

第三週:數據分析思維數據分析能力的高低,不以工具和技巧決定,而以分析思維決定。

在一場戰爭中,士兵裝備再好的武裝,進行再嚴苛的訓練,若是衝鋒的方向錯了,那麼迎接他們的唯有一敗塗地。

分析思維決定一場「數據戰爭」中的衝鋒方向。只有先養成正確的分析思維,才能使用好數據。

既然是思維,它就傾向於思考的方式,Excel函數學會了就是學會,分析則不同。大多數人的思維方式都依賴於生活和經驗做出直覺性的判斷,以「我覺得我認爲」展開,好的數據分析首先要有結構化的思維。

麥肯錫是其中領域的佼佼者,創建了一系列分析框架和思維工具。最典型地莫過於金字塔思維。

這篇文章簡述了該思維的應用,「快速掌握麥肯錫的分析思維」。你能學會結構化思考,MECE原則,假設先行,關鍵驅動等方法論。

除此以外,還有SMART、5W2H、SWOT、4P4C、六頂思考帽等,這些都是不同領域的框架。框架的經典在於,短時間內指導新人如何去思考,它未必是最好的,但一定是性價比最優的。數據分析思維,是分析思維的引申應用。再優秀的思考方式,都需要佐證和證明,數據就是派這個用處的,「不是我覺得,而是數據證明」。

現代管理學之父彼得·德魯克說過一句很經典的話:如果你不能衡量它,那麼你就不能有效增長它。如果把它應用在數據領域,就是:如果你不能用指標描述業務,那麼你就無法有效增長它。每一位數據分析師都要有指標體系的概念,報表也好,BI也好,即使機器學習,也是圍繞指標體系建立的。

下圖就是一個典型的指標體系,描述了用戶從關注產品、下載、乃至最後離開的整個環節。每一個環節,都有數據及指標以查詢監控。

不同業務背景需要的指標體系不同,但有幾個建立指標的通用準則。這篇文章深入介紹了「如何建立數據分析的思維框架」。你將區分什麼是好指標、什麼是壞指標、比率和比例、指標的結構、指標設立的維度等概念。

數據分析不是一個結果,而是一個過程。幾乎所有的`分析,最終目的都是增長業務。所以比分析思維更重要的是驅動思維落地,把它轉化爲成果。

數據分析思維是常年累月養成的習慣,一週時間很難訓練出來,但這裏有一個縮短時間的日常習慣。以生活中的問題出發做練習。

這家商場的人流量是多少?怎麼預估?

上海地區的共享單車投放量是多少?怎麼預估?

街邊口的水果店,每天的銷量和利潤是多少?怎麼預估?

這些開放性問題起源於諮詢公司的訓練方法,通過不斷地練習,肯定能有效提高分析思維。另外就是刷各種CaseBook。

優秀的數據分析師會拷問別人的數據,而他本身的分析也經得起拷問。