合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
数据已经成为许多企业和组织的一项宝贵资产。他们正在对数据进行分析,以获取有关市场、客户和自身运营的洞察。他们正在利用数据来推动数字化转型计划并支持新的数据密集型服务。大量的数据也是人工智能和机器学习计划的重要组成部分。
但整理、管理和分析数据是当今一项重大挑战。据市场研究机构IDC称,创建、捕获、复制和消费的数据总量每年增长20%以上,预计到2027年将达到约291 ZB。
以下来看看2023年备受关注的10家大数据初创公司。
Airbyte
联合创始人兼首席执行官:Michel Tricot
将数据从运营应用和数据库转移到数据仓库、数据湖和其他分析系统是数据分析中最具挑战性的步骤之一。
市场上有很多商业数据移动和集成工具,但Airbyte凭借它的开源数据移动/数据集成引擎以及用于设置和运行数据移动操作的连接器,吸引了人们的关注。
今年9月该公司表示,在短短三个月内,Airbyte的用户社区已经使用Airbyte在今年6月推出的无代码连接器构建器构建了1500多个数据连接器。10月,该公司宣布推出了矢量数据库连接器,这种连接器对于把数据源连接到AI应用是至关重要的。
Airbyte成立于2020年,总部位于美国旧金山,在2021年12月进行的B轮融资中获得1.5亿美元。
首席执行官:Andy Byron
Astronomer开发了Astro统一数据编排平台,用于集中数据流的可见性、控制并简化数据管道部署。该系统可以帮助企业和组织扩展大规模数据集成、数据分析以及AI和机器学习任务,满足关键的金融服务、零售和电子商务应用的数据需求。
Astro基于开源的Apache Airflow工作流管理技术(最初是由Airbnb开发),用于数据工程管道。
12月6日,Astronomer推出了最新版本的Astro,具有简化的连接管理功能、新的系统升级实用程序和新的系统部署功能,以降低运营成本。
Astronomer成立于2018年,总部位于辛辛那提和旧金山,并在2022年3月进行的C轮融资中获得了2.13亿美元。Astronomer在2023年初进行了裁员,但根据9月份的报告显示,今年上半年Astronomer的收入同比增长了206%。
联合创始人、首席执行官:Barry McCardel
大数据行业有众多公司开发了用于管理、集成、转换、分析和可视化数据的复杂技术,但共享和发布分析任务的结果仍然是一大挑战。
Hex Technologies开发了Hex平台,一个用于协作分析和数据科学任务的现代数据工作空间系统。该平台包括了AI驱动的工具、协作数据笔记本、用于开发具有数据可视化的应用的工具以及数据集成技术——所有这些都使得使用交互式数据应用和故事连接和分析数据以及共享工作成为可能。
Hex总部位于美国旧金山,是由McCardel、首席技术官Caitlin Colgrove和首席架构师Glen Takahashi在2019年创立的,之前他们曾在Palantir共事过。Hex在2022年3月进行的B轮融资中获得了5200万美元。
今年10月,Hex推出了Hex 3.0,其中包含新的AI功能、新的计算引擎、新的元数据引擎以及用于将洞察转化为交互式体验的App Builder工具。今年早些时候,Hex推出了Hex Magic工具,将大型语言模型的强大功能直接引入Hex工作区。
联合创始人、首席执行官:Khawaja Shams
Momento在2022年11月凭借Momento Serverless Cache产品走出隐身模式,该产品可以优化和加速在AWS或者谷歌云上运行的任何数据库。
缓存通过更快交付常用的或者经常使用的数据来加快数据库响应。但Momento的创始人认为,当今的缓存技术并不是为当今的现代云堆栈设计的。Momento称,高度可用的Momento缓存技术每秒可以执行数百万此处理,并作为后端即服务平台运行,这意味着用户无需管理基础设施。
Momento总部位于美国西雅图,由首席执行官Khawaja Shams和首席技术官Daniela Miao共同创立,两人曾在AWS工作,并且是亚马逊专有NoSQL数据库服务AWS DynamoDB背后的工程负责人。
联合创始人、首席执行官:Jordan Tigani
6月22日,MotherDuck推出了MotherDuck无服务器云分析平台的第一个版本,该平台结合了云和嵌入式数据库技术,可以轻松分析数据,无论数据位于何处。
该平台是基于MotherDuck的DuckDB开源嵌入式数据库,通过将进程内数据库的速度与云的可扩展性相结合,这个云系统可以轻松地分析任何规模的数据。
MotherDuck 认为,近年来数据分析的大部分进步都面向拥有超过 PB 数据的大型企业和组织,而忽略了拥有类似数据量的中小型公司。
MotherDuck总部位于美国西雅图,是由Google BigQuery创始工程师Jordan Tigani在2022年联合创立的,现在担任该公司的首席执行官。今年9月,MotherDuck在B轮融资中获得了5250万美元,融资总额达到1亿美元。
创始人、首席执行官:Vinoth Chandar
初创公司Onehouse标榜自己是“数据的新基石”,为云原生、完全托管的数据湖站服务打造了基础。
该公司的服务是基于Apache Hudi的,一个开源事务数据湖项目,可为数据湖带来数据库和数据仓库功能,其目标是充当不同数据存储库之间的数据集成层。
Onehouse成立于2021年,总部位于美国加利福尼亚州门洛帕克,在2022年初走出隐身模式。
今年2月,Onehouse在A轮融资中获得了2500万美元。Onehouse还推出了新的Onetable技术,让用户能够利用基于Hudi的数据湖屋,同时充分利用Databricks和Snowflake中的原生性能加速功能。
联合创始人、首席执行官:Justin Borgman
数据湖分析平台开发公司Starburst成立于2017年,是大数据领域较为成熟的初创公司之一。但Starburst凭借其基于公司核心的MPP SQL查询引擎(基于Trino开源技术构建)继续加快发展势头,实现了对分布于多个数据源的大型数据集的查询。
Starburst的产品组合包括Starburst Enterprise平台和Starburst Galaxy完全托管云服务。今年9月,Starburst通过新的云迁移功能(包括Starburst Galaxy中的本地连接)扩展了这两个功能,随后在11月推出了在Starburst数据湖上构建交互式应用的新功能,包括用于近实时分析和自动化数据治理的流式摄取。
Starburst总部位于美国波士顿,在2022年2月进行的D轮融资中获得了2.5亿美元,融资总额达到4.14亿美元,当时的估值达到33.5亿美元。
联合创始人、首席执行官:Mona Rakibe
数据可观测性是大数据领域最活跃的领域之一,过去五年中涌现了很多初创公司,提供监控数据流的技术以提高数据质量和可靠性。
Telmai成立于2020年,总部位于美国旧金山,是较新的初创公司之一。Telmai以AI驱动的数据可观测性平台可以帮助数据团队使用一系列数据质量指标和KPI来自动监控数据管道过程,并主动实时检测和调查数据异常。
Telmai在今年9月发布了新版本的软件,其中包含许多新功能旨在简化和加速数据可观测性的采用,包括历史数据的“时间旅行”回溯性分析、跨三大公有云的私有云选项、以及针对异构数据管道的端到端可观察性。
Telmai在今年6月获得了550万美元的种子资金。
联合创始人、首席执行官:Bala Kuchibhotla
Tessel采用了与传统云数据库不同的方法。Tessel的云原生托管数据库即服务并没有采用自己底层专有的数据库引擎,而是支持Oracle、Microsoft SQL Server、Postgres和MySQL数据库。
Tessel表示,凭借自己运行在Azure或者AWS云平台上的数据基础设施和管理平台这一独特设计,可以以更高的性能和更低的成本运行重型事务数据库工作负载。
Tessell总部位于美国加利福尼亚州圣拉蒙,由首席执行官Bala Kuchibhotla和副总裁/工程负责人Kamal Khanuja在2021年创立,两人此前都曾在Nutanix和Oracle工作。Tessell在2022年11的A轮融资中获得了来自Lightspeed Venture Partners的3400万美元。
联合创始人、首席执行官:Tim Wagner
Vendia开发了一个基于区块链技术的数据协作平台,通过跨公司、云、系统和业务网络实现实时数据共享和工作流程自动化,帮助组织克服“数据蔓延”。
Vendia(公司名称源自显示重叠数据集的“维恩图”)成立于2020年,总部位于美国旧金山。Vendia在2022年5月的B轮融资中获得了3000万美元,融资总额达到5000万美元。
TOP