合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
到底高级的数据分析师需要啥能力?这是很多人心中的疑惑。网上流行的都是Excel,SQL,Python,都是数据分析从0到1,那到底从1到100该弄些啥?陈老师给大家准备了一个《数据分析年底盘点》系列分享,今天,就从很少人讲的“能力”开始。
首先,咱先清晰下:知识、技能、能力的区别:
1、知识,比如统计学、数学、运筹学、机器学习,知识有理论体系,可以对着书学。
2、技能,比如Excel、SQL、Python、Tableau等软件。可以通过反复操作提升的。
3、能力,比如业务理解,沟通,逻辑思维,汇报等,这些很重要但没有标准教程。
那想要完成从1到100的成长,数据分析师该具备哪些能力呢?
这是脱离底层SQLboy,取数工具人的第一步。组长级以上的数据分析师,都得跟业务直接沟通项目,数据部门总监要上经营分析会,不懂业务是过不去的。一个公司的业务,有战略、战术、战斗三层,数据分析师的理解,也是分三层次的(如下图):
图片
想要全面理解业务,可能需要在行业里待很多年。但使用价值链模型+财务报表,可以快速理解一个行业的主要收入、成本结构,快速建立认知,应付面试是够了。具体的业务流程梳理,可以借助企业的SOP+业务系统的流程,快速理解。
因为业务流程非常灵活多变,很多时候高级的数据分析师要自己动手梳理指标(而不是背诵AARRR之流)梳理指标体系。梳理指标体系需要结合具体业务流程(即业务理解里战斗层)。数据指标有总分式和流程式两种基本形态(如下图),但很多时候,业务流程本身很复杂,步骤非常多,因此需要有能力细细梳理。
图片
设计标签能力和梳理指标一样重要,但是经常被人忽视。高级的数据分析师可不是只会把维度表里的城市、性别、年龄拖出来用,而是能很敏锐地从业务口中捕捉到“高级用户”“长线运营”“防御性产品”这种词语,然后试着用数据量化。
这些有业务含义的标签,俗称“黑话”“行话”,是衡量一个数据分析师对行业理解的重要标准。当然,能随时设计一个新标签,更是高能力的体现(如下图):
图片
有了指标和标签,可以开始取数了。但未经处理的原始数据需求,经常是混乱的,比如:
“喂!给我个数,就常规那种数就行,快点!”
“给我预测下明年销量,不用100%准,99%准就行”
“帮我算算哪个用户不买单,我去了他就买的那种”
一个合格的数据组长、部门经理,有能力把这些混乱的表达,整理成标准化的指标+维度,并且能弄清业务看数据的目的。这是非常重要的能力!很多同学就是因为自己的领导没这种能力,才被虐得死去活来。
图片
一个优秀的数据部门经理,则可以从常规取数需求中,发现开发看板,开发模型的机会,从而从部门争取更多功劳,这是更宝贵的高级能力了。
所谓分析逻辑,即是如何用数据说明问题,这里有两种典型的逻辑
1、拆分逻辑,从一个主指标出来,层层拆分,找到问题答案
2、假设逻辑,先提业务假设,再用数据验证假设关系
一般数据分析师在自己看数据的时候,多使用拆分逻辑,从大到小找到问题点。而在和业务部门讨论时,业务可能会提出分析假设,此时要剥洋葱式验证。分析逻辑是数据分析核心能力,如果分析能力不强,那就只能写:“活跃低了,要搞高”这种东西。只会写要搞高的话,基本上与高薪岗位无缘了。
图片
除了利用现有数据,测试也是一个常用工具。但注意!设计实验,是非常考验人能力的。因为统计学的双样本T检验,只会告诉你抽样出来的数字有没有显著差异,但是为啥要拿这两组数字做对比;为啥要比这个指标;有显著差异又说明业务上的啥问题,都得自己想明白才行。
图片
经常有业务方在做ABtest的时候,不去思考两个用户群体,两个版本有没有可比性,不去控制一下干扰因素,搞得测试结果很难解释。前后几次测试不一样,都是源于此。我们常说,一个好的实验得基于业务,针对谁?测什么指标?控什么因素?都得想清楚,这才是推理能力的体现。
高级的数据分析师当然需要有项目管理能力,因为数据分析工作本身就和各个业务有交集。前端埋点没做好,业务规则不清晰,一线人员瞎操作,都会影响数据质量,影响预测的准确性,影响数据看板上线,影响模型落地。所以要有项目协调与沟通能力,推动项目实现。项目管理是所有高级岗位的通用能力。
汇报能力也是一项高级岗位通用能力,只不过对高级的数据分析师格外重要,因为要直面各部门老板,数据严谨性,总结的可科学性,推理的严密性要求都很高。且经常要根据老板们的意图,随时调整汇报方向(见风使舵),这个对个人能力要求是很高的。
TOP