检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 IoTDBServer进程的垃圾回收(GC)时间过长,可能影响该IoTDBServer进程无法正常提供数据读写服务。 可能原因 该节点IoTDBServer实例堆内存使用率过大,或配置的堆内存不合理,导致进程GC频繁。 处理步骤 检查GC时间。
“确定”。 出现此告警时,说明当前flume server设置的堆内存无法满足当前数据传输所需的堆内存,建议堆内存调整为: channel capacity * 最大单条数据大小*通道个数,但xmx参数值不能超过节点剩余内存。 重启受影响的服务或实例,观察界面告警是否清除。 是,处理完毕。
MaxPermSize”的值根据实际情况调大,并单击“保存”,单击“确定”。 出现此告警时,说明当前flume server实例设置非堆内存大小无法满足当前业务使用场景,建议调整“-XX:MaxPermSize”的值为当前非堆内存使用量的两倍(或根据实际情况进行调整)。 重启受影响的服务或实例观察界面告警是否清除。
性能,但由于缺少WAL机制,会出现异常恢复时,数据丢失。 因此,在调优Streaming的时候,这些保证数据可靠性的配置项,在生产环境中是不能关闭的。 父主题: Spark应用调优
morySize”的值根据实际情况调大,并单击“保存”,单击“确定”。 出现此告警时,说明当前flume server实例设置直接内存大小无法满足当前业务使用场景,建议调整“-XX:MaxDirectMemorySize”的值为当前直接内存使用量的两倍(或根据实际情况进行调整)。
“确定”。 出现此告警时,说明当前flume server设置的堆内存无法满足当前数据传输所需的堆内存,建议堆内存调整为: channel capacity * 最大单条数据大小*通道个数,但xmx参数值不能超过节点剩余内存。 重启受影响的服务或实例,观察界面告警是否清除。 是,处理完毕。
thriftServer.useHdfsCollect参数设置为true时,将结果数据保存到HDFS中,但JobHistory原生页面上Job的描述信息无法正常关联到对应的SQL语句,同时spark-beeline命令行中回显的Execution ID为null,为解决JDBCServer O
如果对核数有要求,可以搜索并修改spark.driver.cores和spark.executor.cores的核数取值。 Spark依赖内存做计算,如果以上还是不能满足任务的提交需要,建议扩容集群。 父主题: 使用Spark
result String 参数解释: 更新映射请求操作结果。 约束限制: 不涉及 取值范围: succeeded:操作成功 failed:操作失败 默认取值: 不涉及 请求示例 在node_group_1节点组上缩容1个节点。 /v2/ff8080828997cb24018a1b2d
请求操作结果。非包周期节点组扩容请求下发成功时,会包含该字段且内容为success。 约束限制: 不涉及 取值范围: succeeded:操作成功 failed为操作失败 默认取值: 不涉及 order_id String 参数解释: 订单ID。对包周期节点组进行扩容时,会返回本次扩容产生的订单ID,需要客
时间间隔(ms):20000(默认最小时间间隔20s) 模式:EXACTLY_ONCE,其他默认参数即可 故障恢复策略:fixed-delay 重试次数:3 失败重试间隔(s):60 其他配置保持默认即可 配置作业完成后,可以单击上方“语义校验”对输入内容校验,单击“SQL格式化”对SQL语句进行格
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 Guardian TokenServer实例RPC队列平均时间超过阈值可能导致业务访问OBS变慢,严重时会导致无法正常访问OBS。 可能原因 告警阈值配置不合理。 或Guardian TokenServer实例设置的内存太小,频繁Full GC造成JVM卡顿。
产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 故障状态的DataNode节点无法提供HDFS服务。 可能原因 DataNode故障或者负荷过高。 NameNode和DataNode之间的网络断连或者繁忙。 NameNode负荷过高。
用之后即可创建将数据备份至远端HDFS(RemoteHDFS)的备份任务。 对系统的影响 启用集群间复制功能需要重启Yarn,服务重启期间无法访问。 前提条件 复制数据的集群的HDFS的参数“hadoop.rpc.protection”需使用相同的数据传输方式。默认设置为“pri
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 Guardian TokenServer实例RPC处理平均时间超过阈值可能导致业务访问OBS变慢,严重时会导致无法正常访问OBS。 可能原因 告警阈值配置不合理。 Guardian TokenServer实例设置的内存太小,频繁Full GC造成JVM卡顿。
引起Kerberos认证超时或操作系统用户缓存同步异常,进而导致组件业务故障。 可能原因 告警阈值配置或者平滑次数配置不合理。 CPU配置无法满足业务需求,CPU使用率达到上限。 处理步骤 检查告警阈值配置或者平滑次数配置是否合理。 登录FusionInsight Manager,选择“运维
当节点的实例规格选项后标示“已售罄”时,将无法购买此规格的节点,请选择其他规格节点进行购买。 Master节点中的4核8GB规格不在SLA售后范围内,仅适用于测试环境,不建议用于生产环境。 MRS 3.x及之后版本集群Master节点规格不能小于64GB。 磁盘角色 表1 MRS集群节点磁盘类型
对OMS节点进行重启、替换、修复等操作时,可将OMS配置为维护模式。 本章节仅适用于MRS 3.x及之后版本。 对系统影响 设置维护模式后,非维护操作引起的告警也将被抑制无法上报,直至退出维护模式后,仍然存在的故障才能上报告警,请谨慎操作。 开启MRS集群维护模式 登录FusionInsight Manager。
产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 Hive数据仓库空间写满后系统将无法正常写入数据,可能导致部分数据丢失。 可能原因 Hive使用HDFS容量上限过小。 HDFS空间不足。 部分数据节点瘫痪。 处理步骤 扩展系统配置。
database.max.connections配置项,并修改dbservice.database.max.connections配置的值到合适值,不能超过1000。 保存配置,并重启受影响的服务或者实例。 如果调整完还报超过最大连接数,需要排查业务代码,是否有连接泄露。 父主题: 使用Hive