搜索_华为云

ALM-45636 Flink作业连续checkpoint失败 - MapReduce服务 MRS

WebUI”后的链接进入Yarn页面。根据告警“定位信息”中的任务名找到失败任务，查找并记录失败作业的“application ID”，是否可以在Yarn页面上查看到作业日志。图1 作业的“application ID” 是，执行4。否，执行6。单击失败作业application ID进入作业界面。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
JDK版本不匹配导致启动spark-sql和spark-shell失败 - MapReduce服务 MRS

JDK版本不匹配导致启动spark-sql和spark-shell失败问题背景与现象 JDK版本不匹配导致客户端启动spark-sql、spark-shell失败。原因分析在Driver端打印异常如下： Exception Occurs: BadPadding 16/02/22

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
ALM-45741 请求ECS securitykey接口失败 - MapReduce服务 MRS

对系统的影响当Guardian调用ECS的securitykey接口失败时，可能会导致任务获取访问OBS的临时aksk失败，进而业务无法正常访问OBS。可能原因集群未绑定ECS委托。 ECS底层接口异常，导致请求失败。处理步骤确认是否绑定委托。登录MapReduce服务管理控制台。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hive任务执行中报栈内存溢出导致任务执行失败 - MapReduce服务 MRS

Hive任务执行中报栈内存溢出导致任务执行失败问题背景与现象 Hive执行查询操作时报错Error running child : java.lang.StackOverflowError，具体报错信息如下： FATAL [main] org.apache.hadoop.mapred

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
参考Hive JDBC代码用例开发的业务应用运行失败 - MapReduce服务 MRS

参考Hive JDBC代码用例开发的业务应用运行失败问题背景与现象用户参考Hive组件的“jdbc-examples”样例工程，完成其自身业务应用开发后，运行此应用失败。应用侧报如下异常： .......... 2017-05-11 14:33:52.174 ERROR

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败用户问题 MRS的Hive服务故障，重新启动后，Master2节点上的HiveServer和WebHCat进程启动失败，Master1节点进程正常。原因分析登录Master2节点，查看“/var/lo

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
ALM-23003 Loader任务执行失败 - MapReduce服务 MRS

任务ID 执行失败的Loader任务的ID。任务名执行失败的任务名称。用户标识提交Loader任务的用户。 Details 对告警信息补充。对系统的影响 Loader作业级别告警，执行提交的Loader任务时发生异常导致执行失败，需要用户查看具体日志来确认失败原因，没有返

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19006 HBase容灾同步失败 - MapReduce服务 MRS

ALM-19006 HBase容灾同步失败告警解释告警模块每30s检查一次HBase容灾数据的同步状态，当同步容灾数据到备集群失败时，发送该告警。当容灾数据同步成功后，告警清除。告警属性告警ID 告警级别是否自动清除 19006 紧急是告警参数参数名称参数含义

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12187 磁盘分区扩容失败 - MapReduce服务 MRS

磁盘分区扩容失败可能会对系统产生以下影响：数据丢失：如果在扩容过程中出现错误，可能会导致数据丢失。因此，建议在扩容前备份重要数据。系统不稳定：如果扩容过程中出现错误，可能会对系统文件造成损坏，导致系统不稳定或无法启动。磁盘无法使用：如果扩容失败，可能会导致磁盘无法使用，需要重新格式化磁盘，以便重新分区。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” 问题背景与现象在使用Producer向Kafka发送数据功能时，发现客户端发送失败。图1 Producer发送数据失败可能原因 Kafka服务异常。网络异常。 Kafka

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
使用IE浏览器在Hue中执行HQL失败 - MapReduce服务 MRS

使用IE浏览器在Hue中执行HQL失败问题背景与现象使用IE浏览器在Hue中访问Hive Editor并执行所有HQL失败，界面提示“There was an error with your query.”。原因分析 IE浏览器存在功能问题，不支持在307重定向中处理含有form

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hue
ALM-45451 ClickHouse访问OBS失败 - MapReduce服务 MRS

参数名称参数含义定位信息来源产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响对于配置了冷热分离策略的表，无法读取和写入OBS上的冷数据，同时本地盘上的热数据变冷后，无法移动到OBS上。可能原因

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
输入文件数超出设置限制导致任务执行失败 - MapReduce服务 MRS

输入文件数超出设置限制导致任务执行失败问题背景与现象 Hive执行查询操作时报Job Submission failed with exception 'java.lang.RuntimeException(input file number exceeded the limits

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
ALM-12035 恢复任务失败后数据状态未知 - MapReduce服务 MRS

ALM-12035 恢复任务失败后数据状态未知告警解释执行恢复任务失败后，系统按60分钟周期自动回滚，如果回滚失败，可能会导致数据丢失等问题，如果该情况出现，则上报告警，如果下一次该任务恢复成功，则恢复告警。告警属性告警ID 告警级别是否自动清除 12035 紧急是告警参数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
新建集群Consumer消费数据失败，提示“GROUP - MapReduce服务 MRS

新建集群Consumer消费数据失败，提示“GROUP_COORDINATOR_NOT_AVAILABLE” 问题背景与现象新建Kafka集群，部署Broker节点数为2，使用Kafka客户端可以正常生产，但是无法正常消费。Consumer消费数据失败，提示GROUP_COORDI

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

采用Hcatalog的方式，参数指定对应的Hive库和表，需要修改SQL语句指定到具体字段（需要修改脚本）。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。原来的脚本： sqoop import --connect 'jdbc:mysql://10

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Sqoop
ALM-18026 Yarn上运行失败的任务数超过阈值 - MapReduce服务 MRS

大量应用任务运行失败。运行失败的任务需要重新提交。可能原因任务出于某种错误运行失败。处理步骤检查告警详情。在FusionInsight Manager界面，选择“运维 > 告警 > 告警”，打开告警页面。查看“Yarn上运行失败的任务数超过阈值”告警详情中的“附加信息”，确认监控阈值是否设置过小。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
缩容MRS集群 - MapReduce服务 MRS
缩容MRS集群 - MapReduce服务 MRS

亚健康的节点进行缩容。这些节点实例的健康状态信息可以在MRS上的“实例”管理界面查看。缩容校验策略缩容节点选择完成后，为了避免组件退服失败，不同组件提供了不同的退服约束规则，只有满足了所有安装组件的退服约束规则才允许缩容。缩容校验策略如表1所示。表1 组件退服约束规则组件名称

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core

总条数： 3771

上一页
1
...
7
8
9
...
189
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ALM-45636 Flink作业连续checkpoint失败 - MapReduce服务 MRS

JDK版本不匹配导致启动spark-sql和spark-shell失败 - MapReduce服务 MRS

ALM-45741 请求ECS securitykey接口失败 - MapReduce服务 MRS

Hive任务执行中报栈内存溢出导致任务执行失败 - MapReduce服务 MRS

参考Hive JDBC代码用例开发的业务应用运行失败 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

ALM-23003 Loader任务执行失败 - MapReduce服务 MRS

ALM-19006 HBase容灾同步失败 - MapReduce服务 MRS

ALM-12187 磁盘分区扩容失败 - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

使用IE浏览器在Hue中执行HQL失败 - MapReduce服务 MRS

ALM-45451 ClickHouse访问OBS失败 - MapReduce服务 MRS

输入文件数超出设置限制导致任务执行失败 - MapReduce服务 MRS

ALM-12035 恢复任务失败后数据状态未知 - MapReduce服务 MRS

新建集群Consumer消费数据失败，提示“GROUP - MapReduce服务 MRS

通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

ALM-18026 Yarn上运行失败的任务数超过阈值 - MapReduce服务 MRS

缩容MRS集群 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线