导言
回顾了一下自己过去的职业经历,看到5年前我在BOSS上回答的问题,现在还有人点赞,看来到了5年后的今天,我当初的想法还没有过时,所以今天我打算再补充一下,和大家聊聊数据分析师到底是一份怎么样的工作。

正如我在boss上回答的一样,我认为数据分析师是一个综合能力很强的工作,而且是所有大数据从业者中,综合能力要求最高的,他要懂技术,要懂业务,要懂分析模型,甚至还要懂算法。
其实这些我认为都局限在技能上,更重要的是数据分析师的主动性。在一家公司中,一个好的数据分析师是需要去解决业务问题的,而不是给业务部门当作工具来使用,这样才能体现数据分析师的价值,他的工作流映射在业务部门的工作流中,关心业务要胜于关心数据本身。
那么我们应该如何成为一名优秀的数据分析师呢?
我认为要从几个方面入手:
一、创业精神
我把这个创业精神放在第一个位置的原因是:数据分析师应该做好“迷你CEO“的角色,关心业务的方方面面,从数据的角度来量化业务过程中每一个细节,将实际的业务问题转变成抽象的数据问题,甚至是数学问题。
如果你没有这样的意识,不会去主动思考公司想要的是什么,业务想要的是什么,那么你更无从谈起如何设计数据分析模型。而业务的数据需求这件事情业务并不会主动告诉你,你需要主动去探索和思考。
你需要把自己定位成业务运营人员、业务主管、COO、甚至是CEO,这样你才能真正的理解他们要的是什么,不能只听命而已,也要了解他们为什么要这么去做决定。
有了这个基础我们再看下面的几个方面:
二、指标建模
这里的建模并非是数据开发工作中的数仓建模,而是面向业务问题的指标建模。
它的核心是:对业务目标的拆解和量化。
比如一家电商公司要实现双11的1亿销售额目标,这是一个非常精确业务目标,那我们就需要从业务的角度分析实现这个目标的业务动作,再把每个动作进行量化,从横向的加法(如不同的销售渠道)到纵向乘法(如要获取多少流量,要实现多少支付转化率)
来拆解指标,然后对其中的不同销售渠道,流量、转化率再做拆解。
更复杂一点的情况是,业务部门并没有对自己的业务目标进行量化,或者难以量化,比如他们可能目标是将自己品牌“遥遥领先“。那么你就要思考并与业务同事共同量化目标,什么样的情况才是达到了遥遥领先,比如市场占有率要达到多少,销量要达到多少,品牌的在各平台的搜索量达到多少,对照的数据当前是多少,竞品的数据是多少。。。等等这些,都需要有一个明确的量化。
有了量化的基础,就可以设计指标模型了,其中会涉及到各个指标,无论是最终的结果指标还是过程中的过程指标,都需要一个详细完善的指标模型来讲一个精确的运营故事。
比较著名的业务分析模型:AARRR、RFM等等这些并不要照本宣科,他们被沉淀下来的原因是因为他们的确是在数据分析领域比较普适的模型,但在一家具体的公司针对具体的业务,我们不是要利用这些模型,而是在这些模型思路中创造一个适合实际场景的模型,结合公司现有的业务能力,做自己的模型。
这就是指标建模的能力。
三、技术能力
技术能力往往是企业最不应该关心的,但却是当前市场中最关心的,原因有两个:
1:招聘者认为数据分析技术是他们当前的最大痛点,他们当前的业务问题是需要通过技术手段来解决;
2、招聘方为一个以技术为导向的数据开发团队,他们想要一个更Tech的人来与他们配合工作,缓解他们应对业务部门的压力;
我认为这都不是对数据分析师合适的定位。
当然,技术也很重要,作为一个厨师,光有脑子没有手怎么行,最终你的产出必须是一道实际的菜,而不是你的菜谱。
所以数据分析应该有哪些技术能力呢?
- Excel,可能有些人会觉得这个似乎过于落后,但从运营的角度来说Excel是大家都通用的能力,Excel有它最无法替代的优势:
- 沟通成本低,几乎每个人都能看明白的处理逻辑和灵活的图表,作为日常与不同专业的同事做交流时成本非常低(你应该不会想着拿者SQL代码给别人将你是如何做的透视表吧)
- 图表的美观和效率,虽然使用python或者其他一些工具也可以出一些图表,但从方便程度和交互程度来说,还是Excel好。
- 数据分享,和你沟通的同事很有可能是没有任何数据库权限的,那么有些数据需要分享给别人,还得是Excel
- SQL,数据分析师必备技能,有了这个技能,你几乎可以处理日常工作中的所有问题,它作为通用的关系型数据库标准语言,他的优势不言而喻,会SQL就相当于你有了手,所以这个是必须的技能
- 数据库,请不要被这个吓到,并不需要你去开发一个数据库软件,但你要知道基本的概念,比如内表外表,内键外键,分区分桶,索引和联合索引,虽然大多数工作中,你是不用关心这些,但当你遇到查询上的性能瓶颈的时候,或者你自己需要建表建库来保存你生产的临时数据时,这些知识会帮助你更好的完成自己的工作,这个算是可选技能。
- Python,相对于SQL来说,Python作为一个完备的编程语言,他的好处有很多,比如:
- 处理数据的时候会更灵活
- 你几乎可以做任何你想要做的数据处理,而不需要像SQL一样想用什么函数,你可以很轻易手搓一个只属于你自己的数据处理函数,结合pandas、numpy等数据处理相关的库,可以让你数据分析工作更加得心应手。
- 代码可读性更强,更容易维护
- SQL处理数据时,我们其实很难去控制他在执行层面的过程的,一般都是SQL写好,数据库的计算引擎会自动解析并执行,你无法干预这个过程,而python等编程语言则不同,你可以对他们的处理过程做调整,截断,方便debug或者做性能调优。
- python 代码和其他编程语言一样,读代码的时候你自上而下,自左而右的(你可能会想:这不废话嘛),但你仔细想想,SQL并不是这样的,当我们拿到一个陌生的SQL的时候,你一般都会先看下整体的结构,在SQL代码的末尾看看取的哪些表,怎么关联的,做了什么where条件,group了哪些字段,然后再看取了哪些字段和如何处理的,在逻辑上并非和自上而下的。
- 可以实现的功能更多
- matplotlib等可视化库可以方便得在代码中就把图画好,不用再导出数据到Excel中做。
- 可以配合其他的工具,比如自动导出数据分析报告等,这些都可以通过python来完成,
- 还有其他的任凭想象
- 其实,这个也并非必须,他也有他的局限性,比如在处理大的数据集时,还需要依赖数据库,如HIVE、Spark等,没有python可以,没有数据库不行。
- 处理数据的时候会更灵活
- 各类BI工具
- 这个比较简单,现在目前无论哪个厂家的BI工具,或者开源的,学习过程都很轻松,不同之处在于不同的BI工具的使用流程不同,功能项有细微区别,其实本质上都一样:执行SQL或者其他数据库语言,从数据库中获取处理好的数据,再做处理,并作为图表的源数据生成动态的图表。
- 建议,对各主流BI系统做简单了解,等到实际使用的时候再去深入,相信不到一周的时间应该就可以熟练使用了。
- 算法
- 一般的需求中,对算法的要求几乎没有,等有的时候,相信也不是一个人可以完成的需求了,应该会有一个更专业的人来负责完成这个需求,但在实际项目过程中你可能需要进行配合,所以需要了解下算法的基本原理就好。常规的ML或DL做简单的了解就行,知道其基本原理概念就够了。
四、业务能力
我认为这个能力是数据分析师的所有能力中最容易被忽视的能力
前面说到了,要有创业精神,要把自己置为CEO,COO,运营主管等角色,这样才可以懂得他们要的什么,也同样懂得如何拆解目标,拆解指标,做指标模型。
如果没有这个领域或者行业的业务能力,是做不到以上的,所以,数据分析师并不像程序员或者数据开发一样,像一个标准规格的螺丝钉,数据分析师的垂直性其实很强,电商行业的数据分析师放在金融领域,或者放在工业领域,一定会是一脸懵逼,因为他并不熟悉这些业务。
五、沟通能力
数据分析师在日常工作中,需要大量的和不同部门的同事进行各种沟通,要参与在业务部门中,收集他们的需求做数据反馈的报告,还需要与数据开发沟通,取数的时候要用,同时还需要与产品研发的沟通,获取准确的数据来源是什么,要给数据开发人员提需求,防止他们忽悠你。
这个能力同样重要,你要像一个厨师一样,原材料你要把关,还要关心顾客的喜好,还要会推销自己的红烧肉……,千万不能忽视这个技能。
六、写作能力
你要出数据分析报告,当你需要把自己的产出结果分享给更多的业务人员或者CEO、COO来看的时候,你不可能每个人都和他们讲一遍,你需要用文字和图表组合成一个数据报告,让所有人都能看到你的数据分析结果。
这个能力也非常重要,把一件事情写清楚,表达清楚,让每个人都能理解,他们只有理解你才能相信你、认可你。
这点和沟通能力一样重要。
结论
看吧,作为一个数据分析师并不容易,有些能力是可以短时间内获得的,比如各种的技术能力,但数据分析的思维,和对业务的理解能力,还有像沟通写作的能力,这个则需要长期的训练思考才能养成,但这也是各位应该重视的能力,在目前这样的卷卷职场中,这些能力会成为你的优势,随着AI带来的冲击,技术的成本会越来低,技术未来不会再是一个人的优势,但人在职场中的软实力是无法被AI替代的。
接下来我会把我在过去的职场中积累的经验总结成一套数据分析课程,编入到我们的大数据从业者知识库中,敬请期待!
也欢迎大家关注我们。我会不遗余力的分享,让这里成为一个干净纯粹的大数据相关知识的交流社区。
这里准备了一套全网最全数据分析面试题库,免费领取!
数据分析免费题库
登录领取
暂无资源
评论列表 (0条):
加载更多评论 Loading...