检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
GAUSS-02150 GAUSS-02141: "port1 value is out of range" SQLSTATE: 22003 错误原因:指定的端口号port1超出范围。 解决办法:修改SQL语句中的port。 GAUSS-02142: "sctp_port1 value is out of
节点管理看到的磁盘空间是DWS集群内所有的磁盘即系统盘、数据盘加到一起的容量,而在存算一体集群概览里看到的磁盘空间只是集群内能做表数据存储的可用空间,另外DWS集群中表是有备份的副本数的,表的备份数据也是需要占用磁盘存储的。存算分离集群概览中的磁盘空间,为缓存大小,是实际申请的磁盘空间。
PGXC_GTM_SNAPSHOT_STATUS视图用于查看当前GTM上事务信息。 表1 PGXC_GTM_SNAPSHOT_STATUS字段 名称 类型 描述 xmin xid 仍在运行的最小事务号。 xmax xid 已完成的事务号最大的事务的下一个事务号。 csn integer 待提交事务的序列号。 oldestxmin
memory for serializable conflict tracking is nearly exhausted. 解决方案:可能有空闲事务或遗忘的已准备事务。 level: WARNING GS_111010156 错误码: out of shared memory. 解决方案
集群,查看集群最近7天的告警信息。通过定位信息锁定触发告警的集群名称。 在“集群 > 专属集群”界面找到告警集群,在所在行操作列单击“监控面板”进入监控界面。 选择“监控 > 实时查询 ”可查看当前集群实时会话和实时查询的具体情况,选择“实时查询”可看到当前集群中正在执行的作业状
参数含义 定位信息 集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 可使用会话数量不足,影响业务执行。
集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 数据库名称 告警产生的数据库名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 大量锁请求
集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 数据库名称 告警产生的数据库名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 可使用数据库连接数不足,影响业务执行。
集群resourceId、domain_id等详细信息。 对系统的影响 默认资源池队列阻塞时,集群内所有关联默认资源池的复杂查询(估算内存大于等于32MB)均有可能排队阻塞,只有当正在运行的查询结束时才会唤醒排队中的查询。 可能原因 查询估算内存过大,导致累积估算内存超过动态可用内存上限引发CCN排队。
参数含义 定位信息 集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 可使用会话数量不足,影响业务执行。
错误原因:通信库监听端口创建失败。 解决办法:实例启动失败退出。 GAUSS-04302:"init sctp for stream failed, maybe sctp port already in use" SQLSTATE: XX000 错误原因:通信库监听端口被占用。 解决办
测周期越长,则告警的灵敏度越低;否则灵敏度越高。更详细的界面配置说明参考告警规则。 检查当前集群业务是否占用CPU过高。 在监控面板的页面中选择“监控 > 实时查询”,选择“实时查询”,单击,选择“CPU时间(ms)”,查看CPU时间最长的查询信息。 图1 查看CPU时间信息 和
默认值:配置temp_file_limit为实例所在磁盘空间总容量的10%。 SQL查询执行时使用的临时表空间不在此限制。 bi_page_reuse_factor 参数说明:行存表批量插入场景下,主备DN使用页复制进行数据同步时,可以复用的旧页面空闲空间的百分比。 参数类型:USERSET 取值范围
对系统的影响 磁盘时延高会导致集群性能下降,影响数据的读写速度,可能对业务产生影响。 可能原因 数据库处于业务高峰,存在大量的读写请求,导致磁盘响应慢,时延较高。 处理步骤 进入集群 > 专属集群页面,单击指定集群所在行操作列的“监控面板”按钮进入触发告警的集群的监控面板。
“监控面板”进入监控界面。 选择“监控 > 实时查询”,选择“实时查询”,单击,选择“dn上下盘的最大数据量(mb)”,查看下盘量情况。 和业务侧确认后,选中需要终止的查询ID,单击“终止查询”。 调整对业务语句进行磁盘空间管控的数据库参数,具体参数说明请参见语句磁盘空间管控,操作步骤请参见修改数据库参数。
当前数据库连接已经超过了最大连接数。 错误信息中,non-active的个数表示空闲连接数,例如,non-active为508,说明当前有大量的空闲连接。 创建用户时设置了该用户的最大连接数。 查询数据库连接数,如果显示连接数未达设定上限,可能是由于创建用户时设置了该用户的最大连接数。 处理方法 可优先通过如下方法进行应急处理:
集群名称 产生告警的集群名称。 租户名称 集群所属的租户名称。 告警级别 产生告警的级别。 附加信息 资源ID 产生告警的集群ID。 资源名称 产生告警的集群名称。 资源池名称 告警产生的资源池名称。 首次告警时间 告警首次发生事件,包含告警阈值与当前值。 对系统的影响 资源池磁盘不足,影响业务执行。
dn最大内存峰值(mb)”,查看使用内存最多的查询信息。 图3 查看内存信息 和业务侧确认后,选中需要终止的查询ID,单击“终止查询”。 进一步优化处理,可参见降低内存的处理方案。 告警清除 实例内存使用率下降后,自动消除告警。 父主题: 告警处理
磁盘的历史监控信息,可单击最右的监控按钮,查看最近1/3/12/24小时的磁盘性能指标。 如果数据盘使用率出现短时间内上升然后恢复正常的情况,则说明是业务执行过程中的临时冲高,可通过2调整告警阈值的方式减少告警的上报。 如果存在数据盘的使用率超过90%的情况,通常会触发只读,同时写类型业务报错“cannot
GaussDB(DWS)数据仓库中保存的数据在删除后,可能没有释放占用的磁盘空间形成脏数据,导致磁盘浪费、创建及恢复快照性能下降等问题,如何清理? 清理与回收存储空间对系统的影响如下: 删除无用的脏数据,释放存储空间。 数据库将进行大量读写操作,可能影响正常使用,建议选择空闲时间执行。 数据库的存储空间越大,即数据可能越多,清理的时间越长。