DBLOG
» WTF
Toggle navigation
DBLOG
主页
OCM
1、概览
2、数据导入导出
3、GaussDB(DWS)数据库管理
4、数据库调优与开发实践
5、湖仓一体
6、开发应用
7、集群管理
8、巡检和维运维
About Me
归档
标签
分类 - 3、GaussDB(DWS)数据库管理
1、 存储引擎
2025-05-22 15:09:00
0
0
0
存储引擎概述 图中展示了存储引擎在数据库中1. SQL语句从客户端发到SQL引擎后,首先进行语法分析,然后经过优化器优化生成一个执行计划。2.接下来执行器与存储引擎进行交互,GaussDB(DWS)的存储引擎支持行存和列存(普通列存表和HStore/HstoreOPT),并分别提供了存储访问接口,组织与管理数据的存储。 行存储–page结构 行存表的page页面包括页头(page header)、空闲空间(free space)、数据(heap tuple)下图展示了表文件page页头各个字段的存储信息:tuple:一行数据为一个tuple空闲空间:行指针的末尾与最
2、事务
2025-05-22 15:09:00
0
0
0
事务概述 事务介绍 事务原理概述 - ACID DWS 如何实现 ACID 原子性 - 事务号 原子性 - 事务提交日志(Commit Log) 隔离性/一致性 - 不一致读 隔离性/一致性 - 事务快照与可见性规则 隔离性/一致性 - 并发事务的可见性 (1) 隔离性/一致性 - 并发事务的可见性 (2) 持久性 - 重做日志(Redo Log) 持久性 - 重做日志(Redo Log)查询 分布式事务原理 分布式事务 分布式事务 - 2PC 流程 2PC 流程 - 单节点 DML 2PC 流程 - 跨节点 DML 2PC 流程 - DDL 事务概述 事务介
3、表
2025-05-22 15:09:00
0
0
0
概念 在关系数据库中,数据库表是由一系列二维数组的集合组成。 记录:表中的每一行称为一个记录,也称为元组(tuple),由若干个字段组成。 字段:也称为域或属性,表中的每一列称为一个字段。每个字段包含两个属性:列名和数据类型。 表字段类型 基本数据类型: 数值类型 字符类型 日期时间类型 用户自定义类型: 使用 CREATE TYPE 定义。 数据类型 说明 Smallint 定长2字节整数,范围是 -32768 ~ +32767 Char(n), Nchar(n) 定长字符串,不足的部分补空格。n 是指字节长度,
4、分区表
2025-05-22 15:09:00
0
0
0
分区管理概述 – 分区表优势 分区表和普通表相比,有以下优势: 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。 增强可用性:如果分区表的某个分区出现故障,表在其他分区的数据仍然可用。 方便维护:如果分区表的某个分区出现故障,只需修复该分区即可。 均衡 I/O:可以将不同的分区映射到不同的磁盘,从而平衡 I/O,改善整个系统性能。 分区管理概述 – 分区策略选择依据 分区策略选择依据: 数据具有明显区间性的字段:分区表需要根据有明显区间性字段进行表分区,例如按照日期、区域、数值等字段进行分区,时间字段是最常见的分区字段。 业务查询有明显的区间
5、索引
2025-05-22 15:09:00
0
0
0
概念 索引的分类 - 数据组织方式分类 索引的分类 - 索引方式分类 索引的分类 - 基表类型分类 索引修改与删除 重建索引 索引的使用 索引的利与弊 概念 索引类似书籍的目录,通过目录中的关键字信息,找到书中对应的信息页。索引可以减少搜索元组的时间,提升数据的访问速度。没有索引时,只能遍历表中所有的元组,效率较低。 使用索引会增加插入、更新和删除操作的处理时间,因为这些操作需要同步更新索引信息。 索引需要额外的存储空间。创建过多索引可能对数据库性能产生负面影响。 索引的分类 - 数据组织方式分类 按数据组织方式分类: Btree索引: 使用
6、视图
2025-05-22 15:09:00
0
0
0
[] 视图简介 视图是一个虚拟的表。数据库中仅存放视图的定义,而不存放视图对应的数据。这些数据仍存放在原来的基本表中,因此若基本表中的数据发生变化,从视图中查询出的数据也随之改变。 视图与基本表不同,不是物理上实际存在的,而是一个虚表。 视图管理 创建视图: CREATE VIEW:创建一个未存在的视图。 CREATE OR REPLACE VIEW:如果同名视图已存在,则将替换该视图,否则新建一个视图。 CREATE TEMP VIEW:创建一个临时视图,该视图随着会话退出而消失。 更改视图: ALTER VIEW:修改视图名称、列的默认值、所有
7、Sequence
2025-05-22 15:09:00
0
0
0
[T] Sequence 介绍 Sequence 是一种自增整数序列,主要用于生成唯一标识符。其值按照一定规则自增,具有唯一标识性,因此在数据库中常常被用作主键。 Sequence 使用方法 创建 Sequence CREATE SEQUENCE 语句的语法格式 CREATE SEQUENCE name[ INCREMENT [ BY ] increment ][ MINVALUE minvalue | NO MINVALUE | NOMINVALUE ][ MAXVALUE maxvalue | NO MAXVALUE | NOMAXVALU
8、数据脱敏
2025-05-22 15:09:00
0
0
0
数据脱敏原理 数据脱敏(Data Masking):对敏感数据进行屏蔽的过程。 什么是敏感数据: 任何泄露后可能严重危害社会或个人的数据。 常见的敏感数据包括:个人身份信息、企业不适合公开的信息、设备信息、银行卡号、受保护的健康信息、知识产权等。 为什么需要数据脱敏: 数据脱敏通过对敏感信息进行变形,采用不同的脱敏规则(如替换、重排、加密、截断、掩码等),实现隐私数据的可靠保护。 数据脱敏原则: 尽可能保留脱敏后应用的有意义信息。 最大程度防止黑客破解。 数据脱敏分类: 动态数据脱敏:在访问敏感数据时实时进行脱敏处理,确保返回的数据可用且安全。 静态数据脱敏:将数据抽取后
9、审计日志
2025-05-22 15:09:00
0
0
0
基本概念 数据库审计:属于数据库安全技术之一,主要用于监视并记录用户在数据库系统中的操作行为。审计日志记录操作行为的结果,具体作用包括: 提高数据库安全级别。 记录和分析用户访问数据库的行为。 支持对数据库操作的细粒度筛选。 追溯事故,防止抵赖。 识别安全威胁。 审计日志管理 — 日志文件管理 GaussDB(DWS)使用一些参数控制审计日志的存储目录、大小、保存策略等。 参数名称 类型 参数范围 参数说明 audit_directory string mpp/用户名/pg_audit 审计文件的存储目录。 aud