合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
事实表明,如果通过正确的方式收集大数据,可以帮助企业获得创新的见解。
人工智能利用大数据是值得付出努力的,没有采用和接受这些新技术的企业在生产力方面将会落后,并在市场竞争中面临失败。
现在最流行的是人工智能技术,尽管人工智能已经存在了几十年,但直到最近它才进入主流的消费环境。由于采用的成本高,人工智能行业一直被财力雄厚、能够获得大量数据的企业所主导;这是因为,如果没有当今的大数据技术,人工智能就难有作为。
数据有限的人工智能通常不过是一组规则,只会返回基本答案。数据在帮助人工智能设备了解人类的思考和感受方面发挥着重要作用,还可以实现数据分析的自动化。如果没有足够的数据(人工智能分析的原材料),人们就会看到类似于“人工智能驱动”提供帮助的糟糕例子,即微软的Clippy。
然而,随着数据量的爆炸式增长,现在可以训练算法来提供更好的结果,帮助人们更有效地完成工作。
谷歌公司不断发展的翻译服务就是人工智能在大数据支持下的一个例子。十多年前,谷歌公司从一个基于规则的系统转变为一个基于统计学习的人工智能系统,使用来自真实对话和文本的数十亿个单词来构建一个更精确的翻译模型。然而,这仅仅是一个开始。
现在各行各业的企业都加入了谷歌公司进入的市场。如今,许多时尚零售商(例如ASOS公司)都在提供人工智能服务,以预测顾客的需求,并提供更好的服务。
为了帮助顾客表达自己的时尚感,他们正在使用像WideEyes这样的人工智能图像识别软件来分析顾客的商品照片(例如定位帽子、裙子和手袋等商品),并在现有目录中推荐相关系列。这种近乎即时的分析是通过使用数千张图像训练软件而实现的。
如上所述,使用大数据帮助客户描述他们想要的东西所带来的用户体验好处是不言而喻的,但这只是开始。大数据在许多不同行业的多样化应用是无穷无尽的。许多企业现在甚至利用大数据来帮助他们做出更好的营销决策,比如创建“客户终身价值”模型。
利用人工智能和大数据算法(例如随机森林、余弦相似度和深度循环神经网络),分析所有可能的影响因素和将产生最大影响的返回因素,告诉人们是否应该提供营销资金来鼓励特定客户群的重复购买。
每一个人工智能应用都需要大量数据才能成功。而谷歌、苹果、Facebook、亚马逊和微软五大行业巨头不仅拥有大数据,还拥有Pb规模的数据记录人们的每一个数字动作。
话虽如此,大数据和人工智能并非遥不可及。重要的不仅仅是数量,还有“大数据”的质量。以伦敦交通局提供的数据集为例,这是一个伟大的倡议,可以公开他们的历史旅行数据,制作地铁可视化动态图。
然而,仅凭这一点并不能让深入了解客户正在经历什么,他们要去哪里,延迟和失败的原因等等。为了得出有趣的结论,需要把数据和环境结合起来,例如如天气、事件和其他可能影响交通的因素。
对于五大行业巨头之外的企业来说是不是太晚了?他们把所有的大数据都搞定了吗?不,有们已经看到许多大企业(上面列出的一些)加入了大数据游戏。
然而,数据应该被保留和保护,它是一项资产,应该在企业的资产负债表上确认。如果使用得当,将会给企业带来竞争优势。
早期的大数据处理使用MapReduce等技术,但数据科学家需要更高级的工具,需要更少的编程来绘制不同数据集之间的相关性,解决科学、社会或工业问题。
ApacheSpark是这一领域的领导者,它提供了优雅而简单的方法来表示复杂的分析,企业可以通过轻松地将任务分配到许多机器,在大数据集上运行分析之前,快速地在小样本数据集上运行这些方法。
《通用数据保护条例》(GDPR)将于2018年5月在欧洲全面生效,并将取代现有的数据保护指南。该立法旨在保护个人的个人身份信息(PII),明确说明客户在提供他们的数据时注册了什么。此外,个人对自己的数据有更严格的控制,包括:删除、访问“他们的”数据记录和更改他们的同意的具体权利。
例如,如果一家超市要求顾客提供个人数据以完成他们所要求的一项特定服务,这是一回事,但在服务提供很久之后,保留这些数据并将其用于针对该顾客的营销目的,则需要获得具体的可操作的同意。
一些专家预测,现在储存的消费者数据有一半可能会变成冗余的数据或者需要删除,以符合这个新规定。那么,应该放弃大数据吗?不能,尽管人们不再能够像以前那样通过含糊的声明来获取那么多的数据,但GDPR为优化客户价值交换、获得客户的信任和忠诚、让每一条数据都变得重要带来了机会。从实际层面来看,这可能意味着必须重新获得同意,并重申处理的意图。
尽管这在短期内似乎有很多麻烦,但利用人工智能驾驭大数据是值得付出努力的:不接受这些技术的公司在生产力方面已经落后,并可能在市场竞争中失败。
TOP