检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数含义 定位信息 集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 可使用会话数量不足,影响业务执行。
集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 数据库名称 告警产生的数据库名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 可使用数据库连接数不足,影响业务执行。
源隔离,根据测试结果配置合理的熔断参数,并准备回退方案,确保出现问题后可快速回退。 灵活查询性能管理 灵活查询的SQL类型多样,执行效率和资源消耗差异很大,极端情况下可能会出现某一个“慢SQL”将整个集群性能拖垮的情况。 可根据实时查询统计灵活查询的CPU消耗、内存消耗、执行时间、并发量等信息。
要调整列的大小。如果单元格的文本内容超出了可用的显示区域,则调整单元格列的大小可能会导致DS无法响应。 一个表显示一个属性窗口。 如果一个已打开的表格的属性被修改,刷新并重新打开该表格的属性查看更新后的表格属性信息。 如果列的内容包含空格,会在空格处自动断行以适应该列的显示区域。不包含空格的内容不会自动断行。
该关系在磁盘上的文件的名称,如果没有则为0。 reltablespace oid 该关系存储所在的表空间。如果为0,则使用该数据库的缺省表空间。如果关系无磁盘文件,该字段无意义。 relpages double precision 以页(大小为BLCKSZ)为单位的此表在磁盘上的大小,只是优化器使用的一个近似值。
该关系在磁盘上的文件的名称,如果没有则为0。 reltablespace oid 该关系存储所在的表空间。如果为0,则使用该数据库的缺省表空间。如果关系无磁盘文件,该字段无意义。 relpages double precision 以页(大小为BLCKSZ)为单位的此表在磁盘上的大小,只是优化器使用的一个近似值。
测周期越长,则告警的灵敏度越低;否则灵敏度越高。更详细的界面配置说明参考告警规则。 检查当前集群业务是否占用CPU过高。 在监控面板的页面中选择“监控 > 实时查询”,选择“实时查询”,单击,选择“CPU时间(ms)”,查看CPU时间最长的查询信息。 图1 查看CPU时间信息 和
”,将使用它们的默认值。 说明: Vacuum膨胀率:在数据库中频繁执行UPDATE、DELETE等操作后被删除或更新的行不会从表中物理删除,仅从数据库中被逻辑删除,在完成VACUUM之前这些过期数据仍然存储在磁盘中,从而导致表膨胀。当膨胀率达到运维任务中用户设置的百分比后,就会自动触发Vacuum。
群中所有节点上磁盘读写统计信息的总和。其各字段的名称与GS_REL_IOSTAT视图相同,但含义为各节点上GS_REL_IOSTAT视图同名字段的数值之和。 表1 GLOBAL_REL_IOSTAT字段 名称 类型 描述 phyrds bigint 所有节点读磁盘次数之和。 phywrts
群中所有节点上磁盘读写统计信息的总和。其各字段的名称与GS_REL_IOSTAT视图相同,但含义为各节点上GS_REL_IOSTAT视图同名字段的数值之和。 表1 GLOBAL_REL_IOSTAT字段 名称 类型 描述 phyrds bigint 所有节点读磁盘次数之和。 phywrts
disk_usage_avg double 磁盘平均使用率(%)。 disk_total double 磁盘总容量(GB)。 disk_used double 磁盘使用容量(GB)。 disk_available double 磁盘可用容量(GB)。 disk_io double 磁盘IO(KB/s)。 disk_io_read
MB。用户最多可拥有10个日志文件。 工具日志不记录敏感数据,如查询。 活动日志 DSC将所有日志和错误信息保存到DSC.log文件中。该文件位于log文件夹中。DSC.log文件包含执行迁移的用户、迁移的文件、时间戳等详细信息。活动日志的记录级别为INFO。 DSC.log的文件结构如下: 2020-01-22
使用。 场景一:磁盘满后快速定位存储倾斜的表 首先,通过pg_stat_get_last_data_changed_time(oid)函数查询出近期发生过数据变更的表,介于表的最后修改时间只在进行IUD操作的CN记录,要查询库内1天(间隔可在函数中调整)内被修改的所有表,可以使用如下封装函数:
性能统计 在数据库的运行过程中,会涉及到锁的访问、磁盘IO操作、无效消息的处理,这些操作都可能是数据库的性能瓶颈,通过GaussDB(DWS)提供的性能统计方法,可以方便定位性能问题。 输出性能统计日志 参数说明:对每条查询,以下4个选项控制在服务器日志里记录相应模块的性能统计数据,具体含义如下:
性能统计 在数据库的运行过程中,会涉及到锁的访问、磁盘IO操作、无效消息的处理,这些操作都可能是数据库的性能瓶颈,通过GaussDB(DWS)提供的性能统计方法,可以方便定位性能问题。 输出性能统计日志 参数说明:对每条查询,以下4个选项控制在服务器日志里记录相应模块的性能统计数据,具体含义如下:
dn最大内存峰值(mb)”,查看使用内存最多的查询信息。 图3 查看内存信息 和业务侧确认后,选中需要终止的查询ID,单击“终止查询”。 进一步优化处理,可参见降低内存的处理方案。 告警清除 实例内存使用率下降后,自动消除告警。 父主题: 告警处理
即可在下方视图中查看当前集群各实例的实例内存使用率的具体情况,左上角可选择查看最近1/3/12/24小时/7天的实例内存使用率,判断是否有实例内存使用率突然增大的情况。 图2 实例内存使用率监控视图 如果实例内存使用率频繁出现短时间内上升然后恢复正常的情况,说明是业务执行过程中的临时冲高
在左侧导航栏选择“监控 > 实时查询”,进入实时查询监控页面。 根据选择的指定时间段浏览集群中正在运行的所有查询信息。 单击指定实时查询监控的会话查询ID,进入该会话ID的实时查询的详情页面,在详情页面中会展示当前监控的详细内容。例如用户名称、数据库名称、执行时间、查询语句、查询状态、排队状态、
到需要查看监控的集群。在指定集群所在行的“操作”列,单击“监控面板”。选择“监控 > 节点监控 > 磁盘”,查看磁盘使用率。 各个数据磁盘的利用率,会有不均衡的现象。正常情况下,利用率最高和利用率最低的磁盘空间相差不大,如果磁盘利用率相差超过了5%就要注意是不是有资源倾斜的情况。
TPC-H测试环境 硬件环境 每个测试环境6个节点,配置如下: CPU 16核:Intel Ice Lake 内存:64GB 网络带宽:9Gbit/s 磁盘:SSD云盘,每块600GB,共2块 软件环境 内核版本:Linux 3.10.0-862.14.1.5.h757.eulerosv2r7