项目经验分享|openGauss 唐武国:成为开源项目的贡献者是一件骄傲的事情
开源之夏
项目经验分享
2023 #01
项目导师:汤学明
项目简述:使用机器学习根据openGauss审计日志中的用户操作提取用户操作特点,建立用户操作画像。
# 项目开发情况
1. 项目要求理解
整体的流程如下图所示:
1. 首先需要收集指定时间段的审计审计日志
2. 通过分析改日志来筛除一些无效的数据,设计一些用户特征,例如用户的一次操 作需要包括主体、客体、操作类型(哪个用户对谁做了什么)等信息;
3. 接着需要处理数据集,例如给类别数据编号,划分数据集;
4. 使用为了评估模型分类的好坏,这里选择准确率作为指标;
5. 根据指标的好坏,我们可以调整模型的超参数,使得模型在训练集上分类得更好;
6. 选定好超参数后模型就可以使用了,之后数据库中又会产生许多的用户操作日志,我们可以重新收集日志来迭代模型。
3. 关键问题&解决办法
如何获取审计日志数据
数据库设计
多用户设计