火山引擎云数据库 veDB 在字节在表面上的业务实践

发布时间：2025年03月19日 12:21

域网，并且结合 AEP Store 冗余读过寄给信道。通过以上应付办法，总体而言，veDB（for MySQL）与本地 NVME SSD 存储设备器相比，在高频率敏感型大型企业感受上波动不大，在以外过场有更优所奇科现，因为veDB去除了许多系统设计，比如不用刷脏页、未 Checkpoint。

读过入键值如何动手到超偏高读过延期

什么是读过延期？主以备管理模式中都的主机寄给完均据集便，以备机不能立刻读过取均据集，这其中都的延期被称为读过延期。这其中都遭遇的情况是什么呢？首先是传统意义的主以备管理模式，比如 MySQL 基于 Binlog 互联，读过入键值高频率曾受大型企业负载影响来得大，虽然它在 v5.7 版本引进立体化摄像有助于改善了读过延期，但是并未无论如何面对情况；另外计均存储设备剥离便，的团队并不是基于 Binglog 本体均据集，而是基于 Redo 视图本体均据集，那么 RO 键值如何互联均据集呢？的团队包括了请注意系统设计应付办法。应付办法

的网站（Page）层级立体化摄像有助于：首先读过入键值启动后，veDB则会基于最原先视图，持续从共享存储设备去拉取物理视图立体化解出摄像，值得注意的是，veDB可以根据完全相同的国际标准必需完全相同的立体化有助于；

Redo 视图拉取（Pull）形式：这种形式下的计均键值读过寄给，RW 键值和 RO 键值中都间并未直接的局域网交互（如上图上图），读过入键值从存储设备水池拉取 Redo 视图；

Redo 视图推送（Push）形式：Push 形式是特指在 RW 键值未完形同视图持久化便，直接把 Redo 视图推到读过入键值。

为什么则会有 Pull 和 Push 两种形式呢？两种形式缺点并不相同，在 Pull 形式下，veDB尽可能赞形同 30+ RO 键值，但此时读过高频率较更高，将近在 100 毫秒将近。在 Push 形式下，veDB尽可能赞形同 15 个将近的 RO 键值，此时读过高频率较少，将近在 10 毫秒将近。

均据集导入能够冗余

对于如何更快从 MySQL 迁移均据集，传统意义形式是 MySQL 本身赞形同 Dump、Restore，或者第三方机器赞形同 Myloader Mydumper ，但由于存储设备计均剥离，这种逻辑学转换形式的机动性所奇科现并不佳。

应付办法首先，毕竟 InnoDB 存储设备层物理页格式是保持一致的，veDB引进 Fastloader 机器直接把的网站批量寄给入到存储设备层（Page store），其中都，有些的资讯须要更换，比如 InnoDB 所奇科的 Space ID 、均据库里的 ID 、 LSN等。同时，veDB以外赞形同 MySQL 5.6/5.7/8.0 去导入均据集。

冗余缺点如何呢？总体而言，对于24G（1亿条）均据集，用时从 1637s 降到 32s，机动性大幅提高了 51 倍；对于 69G（3 亿条）均据集，用时从 21585s 降到 95s，机动性大幅提高了 227 倍。

大所奇科DDL检视冗余

原生 MySQL V8.0 版本赞形同 Instant 的 DDL 特性，虽然来得快，但是它较难的过场有限。另外，MySQL 以备机摄像 DDL 的 Binlog 时，它则会引进一个相当大的主以备信道，只有 DDL 制订未完形同，它才能制订其它程序在，这则会造形同相当大的情况。以外各大互联网子公司包主要运用两个第三方机器 Ghost 和 Pity online schema change ，来应付主以备高频率的情况，不过制订稳定性较少。尤其对veDB来说，存储设备计均剥离便，所奇科变得更大，高频率情况更加凸显。

应付办法

veDB引进了 FastDDL 来应付以上情况，具体而言：

常量均据库里（源所奇科）的网站预取：DDL 划分两个阶段，第一个阶段是对原所奇科常量均据库里展开全所奇科扫描，然后在这一阶段展开得心应手的的网站预取；

立体化紧密结合（按均据库里，多控制室）：第二个阶段就是立体化紧密结合，比如按照均据库里立体化紧密结合，的团队要再行度紧密结合所奇科，其中都包含 10 个均据库里，那么则会有 10 个所发；同时，如果控制室中都间通过 Binlog 去互联，的团队可以多控制室一同制订；

存储设备层 Write-Through：veDB 管理模式的在结构上是 Log is Database。为了冗余 DDL，的团队直接寄给入 Page store，Bypass 了 Log store，关键作用一定的慢速作用。

关于冗余缺点，主要有请注意三点：

理论上：大体上 MySQL 尽可能赞形同任何 Online DDL的系统设计；快：它作为一个实质上付诸机器，是 gh-ost 速度的十分之一；静：的团队不引进 Binlog 主以备高频率，比如控制室分别制订 DDL，等待它们制订相比之下，最后 relay 就能未完形同。

有用查去找时才检视冗余

在 MySQL 里面，有用查去找大体都是单线程制订，而单线程的任务一般来得重，还包括解出、冗余、均据集读过取和制订，计均存储设备剥离则会所致跨局域网读过取的网站的信道大大减小。如果有用查去找出现 catch miss，即在缓冲器去找不到均据集，就须要从存储设备区拉取均据集。这种情况频密频发，机动性则会变差。另外，单库里输出功率也大大减小了，均据集输出功率从慢慢地的几T 变形同了现在的几十T，也大大降偏高了有用查去找的负债累累。

应付办法

计均系统设计（以外）直接时才存储设备层：当制订任务时，的团队则会去查去找 B+ 均的倒均第二层键值，得到须要分发的的网站 ID 情况，并且把任务立体化分发给存储设备层；立体化任务分发：的团队引进了立体化制订查去找测度， SQL 层未完形同分发便，可以通过测度收集结果，汇聚并返回给计均层；回所奇科查去找的网站得心应手预取：对于回所奇科查去找，比如查完二级均据库里便，须要去常量均据库里上查去找，的团队则会动手预取。基于以上建议书，veDB也取得了不错的缺点。比如对于 count(*) 系统设计，在不减小计均层 CPU 负债累累的意味着，veDB付诸了 5 倍到 100 倍将近的大幅提高；同时，以 TPCH (100G) 的均据集集测试为例，对于缓冲器准度偏高和准度更高的两种情况而言，从显然到最好的情况，则会有 2 倍到 10倍的大幅提高。

秒杀过场冗余

在类似于秒杀、分时抢购、抢拜年等过场下，大量用户须要在想像中都窄时间内请求消费或者拜年，此时均据集库里将遭遇单行记录大所发更换的老大难情况。一般来说，这则会所致系统广为人知线程减小、 TPS 降偏高、信道减小、系统吞吐降偏高。针对这种情况，以外有两种应付办法，其一是不只能靠均据集库里，在运用层展开检视，但是这种建议书较为有用；其二就是只能靠均据集库里来应付情况。

应付办法

SQL 解释器更换奇科版块标识：对于带有版块更换标识的 SQL ，的团队则会在均据集库里实质上维护一个匹配所奇科，则会将相同均据集的 SQL 放于匹配所奇科的一个队奇科里；批量检视：经过一段时间便，的团队则会针对队奇科里的 SQL 展开合并检视；自然语言糖：为了更高地必需大型企业所需，veDB赞形同打开 Binlog ，以及自然语言糖，比如：Auto_Logic_Commit_Rollback hint，是特指形同功就自动提出，否则 Rollback；另外veDB扩充 Update..returning，赞形同解释器返回。

基于以上系统设计，拟定缺点如何呢？以一个 20c 的虚拟机为例，单行更换机动性尽可能达致 9.3w QPS，多行更换机动性尽可能达致 14.7w QPS。同时，的团队以外已经开始运行了消费市场录影、抖音的本地生活，在大型企业录影带货全过程中都，即使版块消费 QPS 快要猛增到 1.5 万，veDB均据集库里也尽可能包括足够的赞形同。

计均汽缸寄给能够如何扩缩容？

对于一寄给多读过的管理模式，是如何动手到多寄给呢？的团队结合了bit实质上的分库里分所奇科的中都间件与 veDB，包括 Multimaster 赞形同。但是分库里分所奇科的 Multimaster 在寄给流量相当大的过场时（例如 618 或双 11 大型活动）则会遭遇集群充分利用的情况，大型活动结束后又则会遭遇集群缩容的情况。传统意义基于中都间件的分库里分所奇科建议书充分利用须要复制均据集，则会遭遇两个情况：其一是为时与均据集量形同正比，其二是还须要一倍的冗余室内空间，因此须要充分利用。另外，分库里分所奇科以外未一个有效的离线缩容建议书，则会所致在大型局域网大型活动结束后，未办法及时缩容。

应付办法由于计均存储设备管理模式剥离，均据集都在存储设备层。veDB引进共享所奇科的术语，共享所奇科可以在完全相同的均据集库里最最简单中都间展开共享，而完全相同的最最简单在 MySQL 都有相同的 space ID。同时，共享所奇科的所有权（还包括读过和寄给）在任何时候都均限于一个最最简单，它可以在最最简单中都间时序操作，的团队均须要调整表单集的的资讯，无须旋转均据集。其拟定缺点如何呢？首先是充分利用缺点：假如分库里分所奇科有 1000 partitions，并且 1000 partitions 都在一个最最简单上，而要扩充形同两个最最简单，此时充分利用只须要在 1min 内就能未完形同。这样动手的效用是分割全过程与均据集量无关，只须要提前准以备好计均键值资源（虚机或容器），即可迅速未完形同分割。其次是缩容缺点：缩容的形式与充分利用的形式是保持一致的，它也是调整表单集，因此缩容与充分利用的稳定性大体相同。veDB（for MySQL） bit大型企业概念化

首先来知晓一下 veDB(for MySQL) 在bit的作战情况，主要包含更高可视和更高精确两种作战建议书。

更高可视作战建议书

以外 veDB (for MySQL)是三控制室作战，对于更高可视作战建议书，的团队分别在每个控制室作战了存储设备水池，如下图上图。第一个存储设备水池用动手存储设备 Redo 视图，第二个存储设备水池用动手存储设备 Binlog，第三个存储设备水池是 Pagestore。为什么要将 Redo 和 Binlog 分开存储设备？因为 Redo 的存储设备付诸与 Binlog 完全相同，Redo 只须要存储设备两个小时，而 Binlog 须要存储设备一周将近，因此它们所需的输出功率是无论如何完全相同的。如果将二者都加到 SSD，则会对 SSD 造形同想像中都大的输出功率负债累累，因此须要两个存储设备水池。其次的团队则会在主控制室（DC1）作战三个计均键值，在副控制室（DC2、DC3）作战两个计均键值。DC1、 DC2 和 DC3 通过 Binlog 互联，但是在控制室内是通过 Redo log 互联。该作战建议书的优点：一是必需远超过服务项目可视性（RTO ~= 0），通过 Binlog 形式互联，无论哪一个控制室出现情况，DC1 依旧可以包括服务项目；二是机动性好/信道偏高，因为管理工作提出未跨控制室延期，系统设计的团队利用 RDMA + AEP Store 尽可能包括大幅度慢速。该作战建议书的缺点：比如跨控制室不能必需 RPO=0、副控制室读过入键值的读过延期则会较更高。如上图上图，在 DC2 中都，第一个读过入键值的延期是 Binlog 延期，第二个读过入键值的延期是 Binlog 的延期 + Redo log 的延期。在主控制室 DC1 中都只有 Redo log 的延期。

因此，该作战建议书等同于动手对可视性和机动性决定较更高的大型企业过场，同时在想像中都端意味着，比如控制室整体机械故障，可能则会财产损奈何奈何一点均据集。

更高精确作战建议书

该作战建议书也可以被称为为三控制室六手写，它是存储设备层跨控制室作战，只包含两个存储设备水池：LogStore SSD for redo&binlog，和 PageStore。由于它不须要只能靠 Binlog 在控制室间互联均据集，所以可以不须要 Binlog 或者保留时间可以来得窄，因此无须专门的 HDD 存储设备水池来存储设备 Binlog。该作战建议书的优点：一是必需远超过均据集精确度：它只能靠存储设备层通过 column 协议必需均据集精确，因此如果控制室出现情况，其中都的均据集也不则会变为；二是读过入键值都延期偏高：该建议书中都只有 Redo 视图延期，比如 DC1 延期是10毫秒将近，DC2 的延期是从是 20毫秒将近。该作战建议书的缺点：一是机动性相比之下较差：如果要必需 RPO = 0，管理工作机动性相比之下则会较差；二是信道相比之下较更高：因为管理工作提出时须要寄给三手写或者两手写，这个全过程中都必然则会存在跨控制室的 RPC 延期。该作战建议书等同于动手对均据集精确度决定来得更高的大型企业，比如缴交大型企业过场；同时它也等同于动手 QPS 不更高，但是对以备机读过延期敏感的大型企业。类似于大型企业概念化veDB(for MySQL) 主要被运用动手请注意四类大型企业概念化：

小微库里

该库里的在结构上是均据集量较小，QPS 较少。100% 预产出环境最最简单和以外产出环境最最简单都均限于这类情况，等同于 veDB 可以显著地大幅提高资源利用稳定性。历史文化库里该库里的在结构上是均据集量超大，QPS 较少，有有用查去找。钱包历史文化均据集，财经历史文化均据集都均限于这类。以往的历史文化均据集都是导出到 Hive 或者其它的分析系统，须要经过一个 ETL 全过程。另外基于 MySQL 开发计划的一些运用，在 Hive 上须要再行度开发计划。如果通过 veDB 来动手历史文化库里，就不则会有以上情况，上层运用无须二次开发计划适应异构特性的历史文化库里。单体大库里单体库里无法对分库里分所奇科展开分割，该库里的在结构上是均据集量大，QPS 较更高，信道较少。广告库里和财经库里都均限于这类情况。此时，的团队则会通过基于 RDMA 的 AEP Store 或者本地的二级读过CPU，来遏制该库里的情况与终究。分片库里该库里的在结构上是均据集量超大，QPS 较更高，信道较少，同时它尽可能分库里。以外，的团队开始运行了期许中都台和 Ad-Hoc 节假日大型活动。veDB（for MySQL）下一步其发展斜向

veDB以外往请注意斜向其发展：

多寄给管理模式——Multi Master 2.0

Multi Master 2.0 的管理模式如下图上图，合计包含三层，分别是传输均据层、计均层、存储设备层。veDB主要包括了请注意三之外的赞形同：

DDL ：的团队则会包括一套比较最简单的 DDL 自然语言（还包括所奇科、均据库里），便换用分库里分所奇科的形式时，DDL 一般来说是通过DBA提出工单的形式去制订的，现阶段肯定是不行的；同时，也则会包括 Online 系统设计，允许所发 DML；大幅提高分布式管理工作/查去找：赞形同分布式保持一般性读过/寄给，以及赞形同全局二级均据库里；其它：还则会展开保持一般性以备份/趋于稳定，融入 Quick Resharding。

有用查去找：奇科存储设备均据库里和向量化汽缸

MySQL 的查去找能够是来得弱的，一般来说则会把 MySQL 的均据集导入到其它系统中都去动手查去找，这则会产生额外的作战形同本。因此的团队借此大幅提高 MySQL 的查去找能够，比如说，则会引进奇科存储设备均据库里、向量化汽缸和一些其它的冗余赞形同，以此来应付以外的 OLAP 过场须要的有用查去找能够。

CPU冗余所奇科

在这个斜向上，veDB主要包括了请注意三之外的赞形同：

MM 管理工作汽缸：MemTable 本质上是一个单独的存储设备汽缸，独立于 InnoDB 之外，与 InnoDB 付诸形式无论如何完全相同，但是尽可能达致 10 倍的 InnoDB 机动性；另外，veDB包括了比较最简单的 ACID 能够；MＭ存储设备汽缸：广度结合了 RDMA/AEP，另外，视图和均据集一体化；载入制订：在 SQL 解释器上制订了预载入冗余，大幅减少了 CPU 制订特指令均。

除了上述外，的团队下一步还则会在原先显卡、无服务项目器之外对veDB展开迭代。原先显卡之外，veDB则会结合RDMA/AEP/DPU；无服务项目器之外，veDB则会开展自主扩缩容、“自动驾驶”等。

以外， veDB 正现阶段开放邀测。点击“读到过原文”可访问火山湖汽缸官网，大型企业注册账户即可紧密联系工作人员，加入 veDB 邀测。。

脚扭伤吃什么药好
小孩消化不好怎么调理
看病人
吃什么伤口愈合快
胃不舒服怎么快速缓解
老人家肠胃怎么调理
怎样治疗颈椎病最好
先诺欣和民得维哪个效果好
醒酒药
妇科整形

标签：字节引擎火山表面数据库

上一篇：重庆铁路部门筹划春运送“福”送“健康”活动温暖旅客回家路

下一篇：给你说说腹部“小肉球”的那些事，可以抠掉吗？如何处理比较好？