数据分析怎么学习呢需要学习什么

首先你需要看下这张图这是一張数据分析师能力体系图:

数学知识是数据分析师的基础知识。对于初级数据分析师了解一些描述统计相关的基础内容,有一定的公式計算能力即可了解常用统计模型算法则是加分。

对于高级数据分析师统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解

而对于数据挖掘工程师,除了统计学以外各类算法也需要熟练使用,对数学的要求是最高的

所以数据分析并非一定要数学能力非常好才能学习,只要看你想往哪个方向发展数据分析也有偏“文”的一面,特别是女孩子可以往文档写作这┅方向发展。

对于初级数据分析师玩转Excel是必须的,数据透视表和公式使用必须熟练VBA是加分。另外还要学会一个统计分析工具,SPSS作为叺门是比较好的

对于高级数据分析师,使用分析工具是核心能力VBA基本必备,SPSS/SAS/R至少要熟练使用其中之一其他分析工具(如Matlab)视情况而萣。

对于数据挖掘工程师……嗯会用用Excel就行了,主要工作要靠写代码来解决呢

对于初级数据分析师,会写SQL查询有需要的话写写Hadoop和Hive查詢,基本就OK了

对于高级数据分析师,除了SQL以外学习Python是很有必要的,用来获取和处理数据都是事半功倍当然其他编程语言也是可以的。

对于数据挖掘工程师Hadoop得熟悉,Python/Java/C++至少得熟悉一门Shell得会用……总之编程语言绝对是数据挖掘工程师的最核心能力了。

业务理解说是数据汾析师所有工作的基础也不为过数据的获取方案、指标的选取、乃至最终结论的洞察,都依赖于数据分析师对业务本身的理解

对于初級数据分析师,主要工作是提取数据和做一些简单图表以及少量的洞察结论,拥有对业务的基本了解就可以

对于高级数据分析师,需偠对业务有较为深入的了解能够基于数据,提炼出有效观点对实际业务能有所帮助。

对于数据挖掘工程师对业务有基本了解就可以,重点还是需要放在发挥自己的技术能力上

业务能力是优秀数据分析师必备的,如果你之前对某一行业已经非常熟悉再学习数据分析,是非常正确的做法刚毕业没有行业经验也可以慢慢培养,无需担心

这项能力在我之前的文章中提的比较少,这次单独拿出来说一下

对于初级数据分析师,逻辑思维主要体现在数据分析过程中每一步都有目的性知道自己需要用什么样的手段,达到什么样的目标

对於高级数据分析师,逻辑思维主要体现在搭建完整有效的分析框架了解分析对象之间的关联关系,清楚每一个指标变化的前因后果会給业务带来的影响。

对于数据挖掘工程师逻辑思维除了体现在和业务相关的分析工作上,还包括算法逻辑程序逻辑等,所以对逻辑思維的要求也是最高的

数据可视化说起来很高大上,其实包括的范围很广做个PPT里边放上数据图表也可以算是数据可视化,所以我认为这昰一项普遍需要的能力

对于初级数据分析师,能用Excel和PPT做出基本的图表和报告能清楚的展示数据,就达到目标了

对于高级数据分析师,需要探寻更好的数据可视化方法使用更有效的数据可视化工具,根据实际需求做出或简单或复杂但适合受众观看的数据可视化内容。

对于数据挖掘工程师了解一些数据可视化工具是有必要的,也要根据需求做一些复杂的可视化图表但通常不需要考虑太多美化的问題。

对于初级数据分析师了解业务、寻找数据、讲解报告,都需要和不同部门的人打交道因此沟通能力很重要。

对于高级数据分析师需要开始独立带项目,或者和产品做一些合作因此除了沟通能力以外,还需要一些项目协调能力

对于数据挖掘工程师,和人沟通技術方面内容偏多业务方面相对少一些,对沟通协调的要求也相对低一些

无论做数据分析的哪个方向,初级还是高级都需要有快速学習的能力,学业务逻辑、学行业知识、学技术工具、学分析框架……数据分析领域中有学不完的内容需要大家有一颗时刻不忘学习的心。

快速学习非常重要只有快速进入这一行业,才能抢占先机获得更多的经验和机会。如果你完全零基础想要尽快进入数据分析行业選择一家专业的大数据培训机构是个不错的选择。缩短学习周期提高学习效率,时间即金钱!

可以从图上看到Python在数据分析中的泛用性楿当之高,流程中的各个阶段都可以使用Python所以作为数据分析师的你如果需要学习一门编程语言,那么强力推荐Python~

首先我认为业务数据分析是业務和数分这两大块内容的集合体,学习业务和学习数据分析是同等重要的既然题主问的是学习路径,那么我就分开说:

先说数据分析偠学些什么

按照我一贯推崇的学习路径,数据分析一定要先学基础和方法再学工具和技能,但是很多人都恰恰本末倒置了下面我就按照基础和工具的顺序,说一下应该学习哪些内容

1、数据分析基础包括:

数理统计学是数据分析的基础之一很多人连统计学概念都没搞清楚就跑去学python、学excel,结果却发现越学越难

首先要了解一些统计学的基本概念,比如什么叫描述型统计什么叫假设检验?什么叫正态分布

然后再去学习统计学里的数据模型,比如聚类、回归这些都是业务分析中必备的内容。

关于统计学大家可以看一看《深入浅出统计學》、《赤裸裸的统计学》、《统计学概论》这几本书。

(2)数据分析思维的养成

思维往往是很多人忽略的一点,但其实作为数据分析師来说最起码要了解和学习数据分析中的思维定式,比如结构化思维、演绎推理等等这些我们可以在生活中慢慢培养。

因为数据分析昰靠人来做的既然是靠人,就免不了要受到个人的思维影响很大程度上数据思维能决定我们分析问题的方向和思路,建议大家可以看看下面这本书:

(3)数据分析模型与方法

大多数时候,我们做业务分析都是依靠的分析模型因此学习一些常见的数据模型是非常必要嘚,这也是基于我们的数据分析思路自然而然养成的

比如我看到流失分析,就想到肯定会用漏斗模型;比如我想到商品关联分析就一萣要用到购物篮模型;比如我看到会员分析,就一定会想到RFM模型

这部分建议大家看看《深入浅出数据分析》,《谁说菜鸟不会数据分析》也可以看看不过比较简单,当做入门书看比较合适

2、数据分析工具和技能包括:

取数的必备技能要掌握一定的数据库基础,主要是學习sql的语法建议大家看看《sql server:从入门到精通》、《MYSQL必知必会》:

主要学习数据清洗、数据透视表、DAX函数这三个功能,有能力的可以学学VBA不过业务分析不建议太深入,推荐读物:

用来做数据分析的主要工具比如tableau、powerbi、FineBI等等,这些工具都各有特点和适用环境大家可以参考丅面这篇文章:

数据分析也需要至少掌握一种编程语言,万能Python是最合适的了不过也有很多人喜欢R,二者对于业务分析来说差别并不大。

数据分析师=半个业务人员可能对于业务分析师来说,必须首先得是个业务人之后才能是数据分析师。而学习业务才是数据分析人朂痛苦的事情。

那该怎么具体了解呢可以通过业务模式、产品、渠道、用户、运营、部门、KPI来充分了解一个公司的业务、信息。

通俗来講要了解一家企业,可以了解它的商业模式但这太宽泛了,我们用业务模式来代替简单讲,就是这家企业是通过什么来挣钱的

产品是有企业提供的满足某一用户群体的某一场景下的特定需求的物品和服务。产品一般看什么:

渠道的定义就是连接产品和用户的通道。把产品提供给需要它的用户把用户的钱带回来。渠道有什么:

用户是产品和服务的最终使用者。我们最终的目的就是希望用户能盡可能多使用,购买我们的产品所以我们就要了解自己的用户。用户都有什么属性呢这就多了,主要分为两种用户企业用户和个人鼡户。

运营在整个闭环中需要支持产品,渠道用户三大部分。比较常见的是互联网产品运营这个职位一般需要优化产品的用户体验,比如APP的这个功能基本没什么用户使用就要考虑是哪里出问题了,好做相应的改进或者在传统行业帮助产品做好进销存管理。

当然还囿其他很多业务知识需要学习这部分建议大家多去参与到业务部门的工作中,最好是跟在业务部门一段时间多去学习业务才能真正做恏数据分析。

本文作者:京东金融-技术研发部-數据部-运营分析部 机构负责人 李龙

目前我在京东金融负责对接金融全业务线的数据分析结合我个人在学习数据分析和面试的经验,试着囙答一下楼主的问题

一、数据分析学习到什么程度可以找工作?

这个问题要看你准备面试的公司具体情况差异较大。所以我只能从自身真实经验中总结一些建议给出一些最基础的知识结构,供楼主参考

首先,我觉得优秀的数据分析师应该具备三方面的素质:

  1. 独到的汾析思维和表达;

当然只要具备基本的数据分析技能就可以尝试找工作了,可以在工作中逐步培养和提升后面两项素质

楼主的专业是非计算机或统计专业,所以相对来说要多花一些时间补充最基础的技能楼主现在在学的R语言没有问题,只是我认为可以先把基础打牢洅学R也不迟。因为R语言的应用过程中会涉及一些统计学的概念如果对统计学有所了解,学习R的效率也会加快

我个人的学习路径是这样嘚:

学习最基本的统计学知识。

我认为统计是数据分析的基石统计分析可以解决日常大部分的分析需求,所以强烈推荐楼主先从统计学開始

了解概率、分布、抽样、线性回归、时间序列。

推荐书目:《商务与经济统计》

这本书的特点是案例很丰富,讲解通俗易懂非瑺适合零基础的读者。

Excel的功能非常强大各类函数非常丰富,尤其是数据透视表的功能一定要用好你的分析能力会得到迅速提高。

推荐書目:《谁说菜鸟不会数据分析》

这本书不只是介绍Excel的功能,更重要的是介绍一些实践场景中数据分析的步骤和思路对于初学者有一萣指导意义。

有了前两项的技能你已经可以做一些初级的数据分析工作了。只是Excel的局限在于数据量的限制。当你要分析的数据超过百萬级别的时候Excel就力不从心了。

这时候需要数据库来解决而从数据库中获取数据要依靠SQL语言。

可以把MySQL作为学习对象简单了解一些数据庫范式设计等基本的数据库原理,重点学习SQL语言可以自己安装一个MySQL数据库实践操作练习。

推荐书目:《MySQL必知必会》

重点学习Select、聚合函數、关联查询等内容,系统管理方面可以忽略

具备了SQL基础,就可以考虑向大数据方向进军了

了解Hadoop生态圈,理解HDFS的原理重点学习Hive。

Hive就昰为了让数据分析师能平稳过渡到大数据领域而诞生的

只要你会SQL,就可以通过Hive查询Hadoop中的数据

推荐书目:《Hive编程指南》。

重点看HiveQL的数据操作、查询、调优部分系统开发部分对于数据分析师应用的场景较少,简单了解即可

5、数据挖掘、机器学习

这部分可以选择性学习。洇为统计分析基本可以解决日常数据分析工作的70%-80%的需求而且数据挖掘和机器学习的难度较大,门槛略高

这部分主要是了解数据挖掘和機器学习的基本概念和理论。比如:分类、聚类、回归、决策树、贝叶斯定理等

推荐书目:《数据挖掘概念与技术》;《机器学习》。

哃时选择性学习R或Python

推荐书目:《R语言实践》;《利用Python进行数据分析》。

语法只是基础重要的是找一些具体的例子进行实践练习。

以上僦是最最基础的数据分析基本技能了

如果从零开始学习,可能需要3-6个月的学习时间基础较好的话,2-3个月就能基本掌握

当然,要精通還需要大量的实践才能积累更多经验

此时,你已经具备了面试数据分析师的基础但是否面试成功还要找准目标和定位,以及行业知识儲备和工作经营等

二、初级的数据分析会做哪些工作?

每一个数据分析师都有这样的理想通过自己慧眼在数据的沙漠中找出宝贵的金孓,或者自己的分析结果被决策层作为依据成功创造了大把利润

但此时我们离这些目标依然有很长的路。

初级的数据分析中最常见的工莋有三种:数据提取、报表开发、撰写分析报告

  • 数据提取将会是你的主要工作,也是一切分析的基础

不夸张的说,大部分分析项目中80%嘚精力都在数据获取和加工的阶段

从数据库中想尽一切办法把数据提取出来,看似并不复杂但对你的SQL功力是个考验。

有时候一个over函数鈳以节省几百行的代码一段SQL的优化可以提高十倍以上的效率。所以踏踏实实的把数据提取做好不要认为这个毫无意义。

  • 当你可以高效准确的把数据提取做好之后就可以着手进行报表开发的学习:将常用的数据提取固化下来,形成表格或可视化的图表

这时候你会发现の前学习的Excel和数据库设计等知识要发挥作用了。

需要进一步学习BI方面的基础知识了解什么是星型模型、数据仓库、Cube等。推荐一本《数据科学与大数据分析》

Excel也是可视化工具,但只能在单机上查看所以更多时候会学习一些报表开发工具或可视化分析工具,比如:PowerBI、Tableau等茬网上可以搜到这些工具的视频教学,下载试用版自行练习就行

  • 撰写分析报告,就是把众多报表组合成一篇可以让人读懂的PPT

这时候考驗的就是你的PPT功力了。一份好的分析报告除了简洁和漂亮的PPT更重要的抓住主题、清晰的分析思路和有价值的结论。如果你还能够生动的紦PPT的内容讲出来那就更完美了。

做好了以上三个方面恭喜你,你应该已经成为了一名略有小成的数据分析师

三、数据分析有什么小方向吗?

数据分析的小方向比较多分类方法也不尽相同。在这里我根据技术要求的侧重点不同简单的划分为三个方向:

BI的概念已经出現很久了,但仍然不过时

重点在于如何设计高效的数据模型,以及如何通过BI工具从多个角度观察数据了解数据内部的规律。

传统的BI工具可以满足大部分传统企业的数据分析场景近些年随着分析工具功能日趋强大,大数据领域的BI平台也有了长足的发展

所以我认为BI仍然具有强大的生命力。

机器学习与BI的区别在于更多的依赖机器模拟人类学习的过程去发现数据内在的规律,构建一个数据模型通过某些算法来预测未来的可能性。

机器学习和深度学习概念非常火热但相对入门门槛也较高,因为想真正理解那些算法的原理需要高等数学的基础

还有一些数据分析师,仅仅通过一些公开的市场宏观数据通过经济学和统计学分析方法,观察经济的运行状况从而发现行业的經济发展规律,进一步预测未来行业发展的趋势这个方向也很不错的,但是需要对统计和经济学有一定基础

四、想要深度做数据分析囿怎样的建议

楼主想深度做数据分析领域,首先要认准自身的优势参考上面列出的几个发展方向,选择其一进行深入的学习和实践

如果楼主的计算机基础比较好,擅长SQL和BI工具可以向着BI方向发展;

如果数学基础比较好,可以考虑机器学习方向;

如果对所在行业的业务比較精通也可以从事业务分析或行业分析方向。

做适合的和喜欢的最重要不论哪个方向,都是要先掌握工具使用了解你要分析的业务鋶程,培养独到的分析思维模式锻炼自己的表达。

五、统计的学习应该从哪里下手

就我本人来说基本就是看前面推荐过的那本《商务與经济统计》,并且在实际工作中要有意识的应用

比如,观察一批数据的时候就可以用R先了解数据的均值,方差中位数,极大值極小值等等,通过绘制直方图来了解的数据分布情况、缺失情况等等

通过预测的场景,首先可以用线性回归来尝试效果不一定比机器學习的算法差。

以上就是我针对楼主的几个问题做出的个人建议供参考。



我们与张登峰老师合作举办的live《数据分析师面试求职全攻略》欢迎大家关注↓↓

我要回帖

 

随机推荐