Paper Time 回顾|MB2:为自治数据库建立行为模型
自治数据库旨在完全自动化数据库部署中的配置和运维任务,例如建立索引和进行参数调优。实现自治数据库的关键是建立能够预测各种优化任务的开销和收益的行为模型。但数据库的系统复杂度、并发操作、以及训练数据的获取代价使得建模具有挑战性。
基于此,今天为大家带来 OceanBase Paper Time 第二期文字版分享回顾,由 卡耐基梅隆大学博士后马林 分享《为自治数据库建立行为模型》,原论文名为 “MB2: Decomposed Behavior Modeling for Self-Driving Database Management Systems” 。为大家介绍一种分解式的建模框架解决上述难点,并利用所建模型准确预测不同优化任务的开销和收益,欢迎大家一起学习讨论分享。
以下为直播实录:
大家好,我是马林,现在 CMU 博士后在读,今天我跟大家分享的论文为“MB2: Decomposed Behavior Modeling for Self-Driving Database Management Systems”,是 2021 SIGMOD 上发表的论文。
MB2 是一个分解式的自治数据库建立行为模型的框架。在现在互联网时代,各种资源、数据非常多的情况下,人们通常会用数据管理系统去控制数据的存储和访问。但随着数据的爆发式增长,数据管理本身也变得越来越复杂,尤其伴随数据量级和数据多样性的增长,这些系统本身需要有很多的设置任务。
我们通常需要 DBA 去管理数据库系统部署中的各种任务,比如说数据管理员需要设置各种各样的索引(一种加速部分数据访问的一种数据结构);或者数据管理员要设置数据库各种各样的参数,比如说进行日志管理的间隔等;尤其是云时代,数据库管理员要去设置数据库资源的大小,有多少 CPU,多少 Memory,多少 IO 等等。这就导致企业需要花费很大成本去雇佣数据库管理员,对于很多大公司或者云数据库的服务商,可能要管理几千个、几十万个数据库,如果每一个数据库都要分配一个数据库管理员的话,就很不现实。