-
数据湖架构在处理数据方面具有巨大的可扩展性。此外,它足够灵活,可以支持多语言数据的新数据分析。为什么需要数据湖?数据湖可以帮助组织执行SQL查询、大数据分析、全文搜索、实时分析和机器学习(ML)等分析来发现见解。调查结果显示,一般企业的数据每年都会膨胀50%。除了
-
看到用户画像的标题,熟悉陈老师的同学就知道:我又要写标签建设的文章了。是滴,再厉害的用户画像也是一个个标签组成的,而标签建设恰好是当前非互联网大厂进行用户画像建设的最大瓶颈。一、指望不上的用户标签几乎所有的互联网大厂的用户画像体系,都是在用户标签基础上搭起来的。而
-
如果你愿意的话,想象一下,一个“垃圾”柜子里堆满了各种你认为离不开的“必需品”,这些物品据称的基本性质呈现了我们许多人在清理时面临的困难,我们为试图决定哪些东西可以保留、扔掉甚至捐赠而苦恼。在很多方面,这类似于数据治理。银行业高管经常哀叹,他们到处都有数据,但不知
-
BI也称为商业智能,是收集、分析和展示数据以支持决策者做出明智的业务决策的过程。BI帮助组织将其原始的生产数据转化为有意义的见解或者知识,以推动其业务战略。BI能够为组织改善决策、提高效率和提升资源利用率。BI仪表盘是BI系统的重要组成部分,能够提供复杂数据的可视
-
译者 | 朱先忠审校 | 重楼简介层次聚类算法(Agglomerative Clustering)是数据科学中最好的聚类工具之一,但传统的实现无法扩展到大型数据集领域。在这篇文章中,我将带你了解层次聚类算法的一些背景,基于谷歌2021年的研究介绍交互式层次聚类(R
-
01引言随着“十四五”规划提出发展数字经济,推动数字产业化和产业数字化转型,各商业银行正处于数字化转型的深水区,在加速金融科技数字化、智能化、服务化的过程中,各领域都有原始的数据积累。以银行金融科技运维为例,配置管理建立后数据使用价值不高,数据问题也愈积愈多,其核