DeepFlow 实战:eBPF 技术如何提升故障排查效率 6 月 22 日,由开源中国主办,华为、上海浦东软件园联合主办的【云技术专场】OSC源创会 · 上海站 · 104期线下沙龙成功举办。来自云杉网络的 DeepFlow 高级产品经理李倩发表了《DeepFlow 实战:eBPF 技术如何提升故障排查效率》主题演讲,展示通过零侵扰数据采集、应用性能指标监控、分布式追踪和持续性能剖析等技术实现零侵扰的高效故障排查。 以下为李倩的演讲回顾,内容由活动现场参 运维资讯 2024-07-09 宇宙之一粟
客户某套Oracle rac业务库出现严重的library cache等待排查过程 简介 数据库版本:Oracle rac 19.9 EE 出问题时间段: 2024.04.07 16:48 到 17:00 核心数据库出现大量的enq: TX - row lock contention、library cache lock、library cache: mutex X、cursor: mutex S、cursor: mutex X等待。 分析方法 由于系统在17点已恢复正常,所以我 数据运维 2024-06-14 三掌柜
OceanBase诊断调优 (十一) ——DDL时报磁盘不足问题排查 1. 背景 由于在4.x的部分版本中,我们对于一些ddl操作还存在磁盘空间放大问题,本文主要介绍了这一类问题的排查。 2. 问题排查 2.1 整体排查链路 2.2 问题现象 DDL过程中报磁盘空间不足,需要确认是否符合预期,如果是符合预期,后续运维操作可能要加空间。 2.3 排查流程 我们需要估算DDL过程需要的大概空间,与磁盘剩余空间进行比较,看是否报磁盘不足时符合预期的。首先是估算DDL过程需 数据运维 2024-06-12 捡田螺的小男孩
日常 Bug 排查 偶发性读数据不一致 日常 Bug 排查 - 偶发性读数据不一致 前言 日常 Bug 排查系列都是一些简单 Bug 的排查。笔者将在这里介绍一些排查 Bug 的简单技巧,同时顺便积累素材。 Bug 现场 业务场景 先描述这个问题出现的业务场景。这是一个支付的场景,如果支付成功了,我们就把支付状态置为 success (主单据更新) 同时写入支付成功时间戳为 t1 (子单据更新)。支付成功之后,我们还需要做其它的动作,做 数据运维 2024-05-20 张二河
高性能数据访问中间件 OBProxy(三):问题排查和服务运维 上篇文章我们讲解了 OBProxy 的安装部署,在实践时,大家还可能因为机器环境、操作顺序不对等问题导致安装部署失败,这时候可以到 OceanBase 的开源社区 问答 板块提问,会有专业的工程师回答你的问题。(也可以加入钉群:33254054 和技术同学面对面交流)完成了 OBProxy 的安装部署后,就可以使用 OBProxy 访问 OceanBase 数据运维 2024-05-07 向阳逐梦
磁盘占用高问题如何排查?三步教你搞定 作者简介:杨嘉力(花名:夏进),OceanBase开源内核高级工程师。 通常情况下,数据库对磁盘的占用量会随着业务的接入时间和业务数据量大增而不断上升,导致磁盘空间不足,进而发生数据无法写入、数据库无法重启等问题。这时我们就需要排查问题根源,使磁盘得以平稳运行。本文以OceanBase 开源3.x版本为例,分享磁盘问题的排查方法,希望对你有所帮助。 排查概括 磁盘问题排查通常包括两方面,一方面,排 数据运维 2024-05-07 大树
你的debug包在Android 14变卡了吗 一、背景 我的App怎么这么卡,谁在代码里下毒了! 有一天突然发现debug包运行变的特别卡顿,经过下面的简单测试发现debug包在Android 14上出了问题。 图片 二、问题排查纪录 常规手段排查 使用了systrace以及内部的debug包 trace工具dutrace进行排查。 结论:CPU空闲,主线程无明显阻塞,看上去就是纯方法执行耗时。 发现怀疑点 第一步排查过程中没有特别大的收获 开发运维 2024-04-16 穿过生命散发芬芳