项目经验分享|openGauss 唐武国:成为开源项目的贡献者是一件骄傲的事情

开源之夏

项目经验分享


2023 #01





项目导师:汤学明

项目简述:使用机器学习根据openGauss审计日志中的用户操作提取用户操作特点,建立用户操作画像。

# 项目开发情况

1. 项目要求理解

整体的流程如下图所示:

1. 首先需要收集指定时间段的审计审计日志

2. 通过分析改日志来筛除一些无效的数据,设计一些用户特征,例如用户的一次操 作需要包括主体、客体、操作类型(哪个用户对谁做了什么)等信息;

3. 接着需要处理数据集,例如给类别数据编号,划分数据集;

4. 使用为了评估模型分类的好坏,这里选择准确率作为指标;

5. 根据指标的好坏,我们可以调整模型的超参数,使得模型在训练集上分类得更好;

6. 选定好超参数后模型就可以使用了,之后数据库中又会产生许多的用户操作日志,我们可以重新收集日志来迭代模型。

3. 关键问题&解决办法

如何获取审计日志数据


数据库设计

多用户设计