检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
_HTTPS_PORT”参数对应值,默认为21003。 例如,“https://10.10.10.176:21003/oozie”。 操作步骤 参考获取MRS应用开发样例工程,获取样例代码解压目录中“src\oozie-examples”目录下的样例工程文件夹“ooziesecu
一致导致部分方法已经更改。 如果报错的是三方包里面的类,可能是因为Spark已经自带了相关的jar包,但是和代码中使用的版本不一致。 操作步骤 方案一: 针对jar包冲突的问题,可以确认是否不需使用三方工具的包,如果可以更改为集群相同版本的包,则修改引入的依赖版本。 建议用户尽量使用MRS集群自带的依赖包。
onfig.xml、validate-rule-session.xml、 validate-rule-user.xml三个配置文件。 处理步骤 以omm用户登录主Master节点的“/opt/Bigdata/om-server_*/apache-tomcat-*/webapps/
第三副本等其他后续副本的存储情况,也参考第二个副本的选择方式。 前提条件 集群里DataNode节点的磁盘总容量偏差不能超过100%。 操作步骤 请参考修改集群服务配置参数,进入HDFS的“全部配置”页面。 调整HDFS写数据时的依据的磁盘选择策略参数。搜索“dfs.block.replicator
业务失败:主机网络读包错误率超过阈值时,请求无法正常响应、超时,可能会导致作业运行失败。 可能原因 告警阈值配置不合理。 网络环境质量差。 处理步骤 检查阈值设置是否合理。 在FusionInsight Manager,选择“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机
处于隔离状态的磁盘或者节点不能及时恢复,可能会对大数据组件运行产生影响,进而影响用户业务使用。 可能原因 磁盘或者节点隔离状态超过慢盘处理超时配置时间。 处理步骤 检查慢盘处理超时原因。 在FusionInsight Manager页面,选择“运维 > 告警 > 告警”,在告警列表中展开此告警的详细
据,导致依赖顶层目录的上游组件(例如Yarn、Flink、Spark等)业务异常或服务异常。 可能原因 告警目录对应的配额值不合理。 处理步骤 检查告警目录对应的配额值是否合理。 在FusionInsight Manager,选择“集群 > 待操作集群的名称 > 服务 > ZooKeeper
继续写入文件。一旦超过该目录分配的最大存储空间,则HDFS写入数据会失败。 可能原因 告警阈值配置不合理。 租户分配的空间容量不合理 处理步骤 查看阈值设置是否合理 查看告警定位信息,获取上报告警的租户名称,租户目录。 在FusiongInsight Manager首页,在“租户
非堆内存溢出可能导致服务崩溃,服务崩溃后无法使用Oozie服务调度任务。 可能原因 该节点Oozie实例非堆内存使用率过大,或配置的非堆内存不合理,导致使用率超过阈值。 处理步骤 检查非堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > Oozie非堆内存使用率超过
主机名 产生告警的主机名。 对系统的影响 Flume证书文件即将失效,对系统目前运行无影响。 可能原因 Flume证书文件即将到期。 处理步骤 查看告警信息。 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24011 Flume证书文件即将过期
MonitorServer证书文件已经非法或损坏,功能受限,Flume客户端将无法访问Flume服务端。 可能原因 MonitorServer证书文件非法或损坏。 处理步骤 查看告警信息。 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24013 MonitorServer证书文件非法或已损坏
对系统的影响 MonitorServer证书文件即将失效,对系统目前运行无影响。 可能原因 MonitorServer证书文件即将到期。 处理步骤 查看告警信息。 登录FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-24014 MonitorServer证书文件即将过期
ala服务功能。 可能原因 Hive服务异常。 KrbServer服务异常。 Impala进程故障。 JDBC或ODBS连接数过多。 处理步骤 检查Impala依赖的服务是否正常。 在FusionInsight Manager首页,选择“集群 > 服务”,查看Hive、KrbServer是否已停止。
影响作业继续执行。 可能原因 该节点JDBCServer存在负载高等原因,需客户通过集群采集的系统指标及作业执行情况关注集群健康度。 处理步骤 检查上报告警的JDBCServer实例 在FusionInsight Manager首页,选择“运维 > 告警 > 告警”,选中“ID”
用户提交到HetuEngine该故障计算实例的SQL任务会执行失败。 可能原因 HDFS服务异常 Yarn服务异常 Yarn队列资源不足 计算实例进程故障 处理步骤 检查HDFS服务状态。 在告警列表中,查看是否有“ALM-14000 HDFS服务不可用”告警产生。 是,执行2。 否,执行4。 参考ALM-14000
响应变慢。 可能原因 Yarn资源队列资源不足。 运行任务量过大,导致Worker节点OMM内存溢出,从而导致Worker节点减少。 处理步骤 检查Yarn资源队列资源是否充足 使用可访问HetuEngine WebUI界面的管理员用户登录FusionInsight Manager。
堆内存溢出可能导致服务崩溃。 可能原因 该节点RangerAdmin实例堆内存使用率过大,或配置的堆内存不合理,导致使用率超过阈值。 处理步骤 检查堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45277 Range
非堆内存溢出可能导致服务崩溃。 可能原因 该节点RangerAdmin实例非堆内存使用率过大,或配置的非堆内存不合理,导致使用率超过阈值。 处理步骤 检查非堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45279 Rang
对系统的影响 直接内存溢出可能导致服务崩溃。 可能原因 节点TagSync实例直接内存使用率过大,或配置的直接内存不合理,导致使用率超过阈值。 处理步骤 检查直接内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45286 TagS
对系统的影响 非堆内存溢出可能导致服务崩溃。 可能原因 该节点TagSync实例非堆内存使用率过大,或配置的非堆内存不合理,导致使用率超过阈值。 处理步骤 检查非堆内存使用率。 在FusionInsight Manager首页,选择“运维 > 告警 > 告警 > ALM-45287 TagS