DBLOG
» WTF
Toggle navigation
DBLOG
主页
OCM
1、概览
2、数据导入导出
3、GaussDB(DWS)数据库管理
4、数据库调优与开发实践
5、湖仓一体
6、开发应用
7、集群管理
8、巡检和维运维
About Me
归档
标签
分类 - 8、巡检和维运维
1、基本运维动作
2025-05-22 15:09:09
0
0
0
常用运维命令 常用运维命令 - 查看集群状态 查询集群状态或单个主机的状态使用以下命令: 运维命令: cm_ctlquery -Cv 参数说明: -v:显示集群详细状态。 -C:按主备关系成对显示集群状态,需与-v参数一起使用。 -d:显示实例数据目录,需与-v和-C参数一起使用。 -x:显示集群所有异常实例,需与-v和-C参数一起使用。 -p:显示集群所有 CN、DN 端口,但不包含从备、CCN,需与-v和-C参数一起使用。 集群可能的状态包括: - Normal:表示集群可用,主备关系正常。 - Degraded:表示集群可用,但数据没有冗余备
2、巡检工具及运维工具
2025-05-22 15:09:09
0
0
0
巡检工具介绍 巡检工具使用规范 巡检任务概述 序号 巡检任务 使用场景 TOP巡检项 使用规范 1 日常巡检 用于集群日常维护,获取集群的健康状态,发现潜在风险问题。 集群状态、负载均衡状态、CPU使用率、磁盘性能和使用率、日志空间大小、内存泄露、数据倾斜、透明大页、周期性备份等 每单周或双周执行一次 2 升级前巡检 用于版本升级前,提前发现可能影响升级的问题。 集群状态、文件系统占用率、磁盘可用空间、防火墙关闭、xid回滚、系统表是否损坏 升级版本前5天内执行 3 扩容前巡检 用
3、 运维监控
2025-05-22 15:09:09
0
0
0
华为云Stack DWS 云服务运维架构 华为云Stack DWS 微服务组件 Controller:整个 DWS 的后台组件,负责管理和调度各个服务。 Monitor:ECF 公共组件,主要用于集群实例的状态监控以及告警/事件的上报。 Event:ECF 公共组件,负责事件/告警管理中心,支持向 SMN、OC、CTS 发送事件和告警。 ECFAgent:部署在集群节点上的代理,接收告警和事件,同时监控集群状态。 DMSAgent:部署在集群节点上的代理,负责采集数据库的资源监控信息和数据库所在节点的系统资源信息。 告警 告警配置 GaussDB
4、业务应急
2025-05-22 15:09:09
0
0
0
常见故障场景和应急手段 故障场景 应急手段 整体性能慢 通过应急“三板斧”,快速恢复集群性能 CPU 使用率高 找到 CPU 占用高的语句,对相关业务进行应急查杀或资源限制,事后进行 SQL 优化 IO 使用率高 找到 IO 占用高的语句,对相关业务进行应急查杀,事后进行 SQL 优化 内存报错 找到内存占用高的语句,对相关业务进行应急查杀或资源限制 锁冲突报错 找到持锁语句,应急查杀并将锁冲突业务错峰执行 集群只读 找到空间占用高的表或语句,清理空间 整体性能慢 数据库系统的性能管理在