甲骨文宣布推出 MySQL HeatWave Lakehouse
2022 年 10 月 18 日 – 甲骨文公司宣布推出 MySQL HeatWave Lakehouse,这款产品能够帮助客户处理和查询对象存储中数百 TB 量级的数据,支持各种文件格式,包括 CSV、Parquet 以及 Aurora 和 Redshift 备份格式。MySQL HeatWave Lakehouse 是 MySQL HeatWave 产品组合的新产品,能够将事务处理、分析、机器学习和基于机器学习的自动化结合在单一 MySQL 数据库中。
MySQL HeatWave Lakehouse 采用大规模并行横向扩展 MySQL HeatWave 架构,根据行业标准基准测试的结果,在运行查询和加载数据性能方面表现出色。此外,客户可以通过单个查询在 MySQL 数据库中查询事务处理数据,并使用标准 MySQL 语法将其与对象存储中的数据组合。甲骨文还宣布推出新的 MySQL Autopilot 功能,可提高性能并让 MySQL HeatWave Lakehouse 方便易用。MySQL HeatWave 现推出了 Lakehouse 的 Beta 版供客户试用,正式版将于 2023 上半年发布。
客户从 AWS、Google 和本地环境迁移到 MySQL HeatWave 之后,已经在各种场景中使用该产品,包括营销分析,特别是广告营销活动效果的实时分析与客户数据分析,从而构建有效的营销活动。还有其他一些客户也从 AWS 迁移到这款产品上,包括汽车、电信、零售、高科技和医疗保健行业的佼佼者。
甲骨文公司首席企业架构师 Edward Screven 表示:“MySQL HeatWave 是多年研究和开发的成果,我们正在将其转化为突破性创新,以应对MySQL 客户面临的更大挑战。事实上,MySQL HeatWave Lakehouse是我们今年就 MySQL HeatWave 的第三个重大发布。存储在数据库之外的数据急剧增长,借助 MySQL HeatWave Lakehouse,客户可以利用 HeatWave 在各方面的优势,处理驻留在对象存储中的数据。MySQL HeatWave 目前在多个云平台上提供一项集成服务,用于事务处理、跨数据仓库和数据湖的分析以及无需数据仓库技术 (ETL) 的机器学习。这样的组合有助于在性能、自动化和成本方面实现大幅度改进,因此进一步加大了 MySQL HeatWave 相较于其他云端数据库服务的优势。”
AMD 首席技术官兼执行副总裁 Mark Papermaster 表示:“我们很高兴能够继续与甲骨文开展合作,并将合作范围延伸到支持其新的 MySQL HeatWave Lakehouse 产品,该产品经过优化,可充分利用我们处理器的各类创新,在由 AMD EPYC 驱动的 Oracle 云实例上运行。AMD 和甲骨文工程团队携手努力,打造出令人印象深刻的 MySQL 解决方案,它能在单个 MySQL 数据库中为事务处理、分析、机器学习和基于机器学习的自动化提供出色的可扩展性和性能。”
甲骨文公司还发布了新的 Lakehouse 基准测试,并为 MySQL HeatWave Lakehouse 和 MySQL Autopilot 引入了多项创新功能。
Futurum Research 高级分析师兼研究总监 Ron Westfall 表示:“MySQL HeatWave Lakehouse 以惊人的速度在以往未曾涉足的 400 TB 云端数据库基准领域开辟出了自己的道路,让这一领域的竞争比以往更加激烈。从处理能力和计算能力来看,MySQL HeatWave Lakehouse 堪称 HeatWave 的一次重大飞跃:从 32 TB 和 64 个节点提升到 400 TB 和 512 个节点。”
MySQL HeatWave Lakehouse 的创新功能
更大数据量,标准 MySQL 语法:客户可以通过 MySQL HeatWave Lakehouse 查询多达 400 TB 的数据,HeatWave 集群可扩展到 512 个节点。客户可使用标准 MySQL 语法查询数据。
稳定的性能和压缩表现:MySQL HeatWave 为存储在 MySQL 数据库或对象存储中的数据提供相同的查询性能,10 TB 和 30 TB TPC-H 基准测试结果印证了这一点。此外,在这两种情况下,它所实现的压缩量和每个节点可以处理的数据量都是相同的。
支持多种文件格式:使用 MySQL HeatWave Lakehouse,客户可以加载和处理以各种文件格式存储的数据,例如 CSV 和 Parquet,以及 AWS 的 Aurora 和 Redshift 备份格式。因此,即便客户的数据并未存储在 MySQL 数据库内,他们也能从 MySQL HeatWave 的优势中获益。无论数据使用何种文件格式存储,客户始终可获得稳定的查询性能。
支持查询 MySQL 中的数据并将其与对象存储中的数据组合:使用 MySQL HeatWave Lakehouse, 客户可以查询存储在 MySQL 数据库中联机事务处理过程 (OLTP) 数据,并将其与存储在对象存储中的数据组合。对 OLTP 数据所做的任何更改都会实时更新,并体现在查询结果中。
面向 MySQL HeatWave Lakehouse 的新 MySQL Autopilot 功能
MySQL Autopilot 为 MySQL HeatWave 提供基于机器学习的自动化功能。多项现有 MySQL Autopilot 功能(如自动预配和自动查询计划改进)针对 MySQL HeatWave Lakehouse 进行了增强,从而进一步降低数据库管理开销并提高性能。此外,我们如今还为 MySQL HeatWave Lakehouse 提供了诸多 MySQL Autopilot 新功能。
自动模式推断:Autopilot 可自动推断文件数据到数据库中数据类型的映射。因此,客户无需手动为要由 MySQL HeatWave Lakehouse 查询的每一个新文件指定映射,从而节省时间和精力。
自适应数据采样:Autopilot 可智能地对于对象存储中的文件进行抽样,从而在尽可能减少数据访问量的情况下收集准确的统计信息。MySQL HeatWave 将这些统计信息用于生成和改进查询计划、确定适宜模式映射以及其他用途。
自动加载:Autopilot 会分析数据以预测将其加载到 MySQL HeatWave 中所需的时间、确定数据类型映射,并自动生成加载脚本。用户不必手动指定文件到数据库模式和表的映射。
自适应数据流:MySQL HeatWave Lakehouse 可动态适应底层对象存储的性能。因此,MySQL HeatWave 可充分发掘底层云基础设施的性能,进而提高整体性能、性价比和可用性。
MySQL HeatWave 的其他增强功能
甲骨文公司宣布推出MySQL HeatWave多项其他增强功能,覆盖机器学习到 VS 代码插件。MySQL HeatWave 的数据库内机器学习功能也已得到进一步增强,添加了对于预测模型的支持。其中添加了新的机器学习解释技术,并且专门针对 MySQL HeatWave 进行了优化。数据科学家现在可以影响自动化 HeatWave ML 训练管道的各个阶段,包括算法选择、特征选择、评分指标和解释技术。HeatWave 机器学习还经过增强,让客户可以将机器学习模型导入 HeatWave。
新的多引擎 Hypergraph 查询优化程序可进一步提高复杂查询的性能,并且不再需要指定联接顺序。新增区域映射,可使用 MySQL HeatWave 为更广泛的查询加速。MySQL 的 VS 代码插件经过增强,可为 MySQL HeatWave 功能提供支持。
适用于分布式云技术
MySQL HeatWave 支持多种云平台,包括Oracle 云基础设施 (Oracle Cloud Infrastructure, OCI) 、AWS 和 Microsoft Azure。对于不愿将数据库工作负载迁移到公有云的企业,MySQL HeatWave 可作为 Oracle 专用区域的一部分进行本地部署。客户还可以将数据从本地 MySQL OLTP 应用复制到 MySQL HeatWave,以实现近乎实时的分析。MySQL HeatWave 始终基于新版本的 MySQL 数据库。
您可能感兴趣的文章
阅读排行
推荐教程
- 11-01阿里云无影升级2.0 云电脑解决方案时代到来
- 11-01阿里云数据库全面Serverless化!与AI共同驱动走向一站式智能数据平台
- 11-012023云栖大会关键词:开放、大模型、MaaS、产业智能升级
- 10-31Serverless化云产品超40款阿里云发布全球首款容器计算服务
- 10-31阿里云给中国所有大学生每人送一台云服务器
- 10-31解密杭州亚运背后科技:核心系统100%上云,20多项全球首创智能应用
- 10-312023云栖大会开幕 阿里巴巴蔡崇信:打造AI时代最开放的云
- 10-31巴黎奥运会将基于阿里云实现云上转播
- 10-31马斯克440亿美元收购Twitter一年后:全力“下云”,成本速降60%,功能代码从70万行减少至7万!
- 10-30中国广电已建700MHz基站59万站 5G用户突破1800万