-
一、Alluxio 介绍1、背景介绍当前计算引擎越来越多样化,存储系统和部署环境也越来越复杂。不同的计算和存储适用于不同的场景。比如 Presto 的即席查询性能比较好,比 Spark 要快很多,而 Spark 又更适合于批量处理。存储系统也是一样的,常
-
一、AB 实验简介AB 实验又称双盲测试、A/B testing、随机分组实验等,主要目的在于降低风险和准确量化实验结果。其基本思想是从大盘中取出一小部分流量,完全随机地分给对照组和实验组,通过回收不同实验组用户的行为数据,应用统计学方法得出结论。早期的
-
去年年初,Jordan Tigani发表了一个演讲《Big data is dead》,这个演讲引发了不少争论。如果是别人谈这件事,可能很多人会不以为然,不过了解Jordan Tigani的履历的人可能就得在脑子里多转几个弯了。图片这哥们可不是一般人,曾经是谷歌B
-
经常有新手同学问:数据分析完整流程是什么样的?今天用一个通俗的例子,让大家看清楚数据分析全流程。通过对比,你也能发现:为啥你觉得自己没有做过完整的数据分析。某天,你的朋友老王对你说:“还上啥班呀,你看你上班一个月才1万块,还不如像我一样卖手抓饼呢,比你上班挣得多多
-
本次分享题目为指标体系的管理驾驶舱场景应用实践,主要介绍管理驾驶舱在快手电商数据运营产品团队中的应用实践。管理驾驶舱的目的是为了在经营管理场景,看清业务并提供业务改进的数据抓手,可以监控业务链路、演化为数据产品、发现新的业务机会。文中将分享管理驾驶舱的设计和建设过
-
十年前,分析师会将分析审核过的数据分享给使用数据的工作人员。现在,企业依靠数据运行,每天都有自动化流程、机器学习模型和成百上千的员工在使用数据。目前,随着人工智能的突飞猛进,数据领域呈现爆炸式增长。公司正在大力投资数据和数据基础设施,将数据用于业务中,无论是分析还