搜索_华为云

WebHCat健康状态异常导致启动失败 - MapReduce服务 MRS

WebHCat健康状态异常导致启动失败用户问题 WebHCat实例启动失败。问题现象在Manager页面上查看到WebHCat实例的健康状态为“故障”，并上报“ALM-12007 进程故障”告警，该告警的服务名称为“Hive”，实例名称为“WebHCat”。且重启Hive服务报错。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
修改MRS集群NTP服务器 - MapReduce服务 MRS

请准备新的NTP服务器并获取IP地址，并设置好集群与新NTP服务器的网络。请确保服务器的NTP服务状态正常，否则将导致本章节操作失败。修改MRS集群NTP服务器对系统的影响更换NTP服务器是高危操作，更换后集群时间可能将会变化。更换NTP服务器前NTP服务器与集群当前时间偏差大于150s，则需先停止集群，防止数据丢失。停止集群期间服务无法访问。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
HDFS上设置配额导致HBase启动失败 - MapReduce服务 MRS

HDFS上设置配额导致HBase启动失败问题现象 HBase启动失败。原因分析查看HMaster日志信息（“/var/log/Bigdata/hbase/hm/hbase-omm-xxx.log”），出现如下异常，The DiskSpace quota of /hbase is

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
修改hostname后导致WebHCat启动失败 - MapReduce服务 MRS

修改hostname后导致WebHCat启动失败问题背景与现象用户修改hostname导致WebHCat启动失败。查看对应节点WebHCat启动日志（ /var/log/Bigdata/hive/webhcat/hive.log），发现报如下错误：原因分析 MRS Web

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题问题现象 ClickHouse集群中某实例节点启动失败，该实例节点启动日志中有如下类似报错信息： 2021.03.15 21:01:19.816593 [ 11111 ] {} <Error> Application:

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
内存不足导致HDFS NameNode启动失败 - MapReduce服务 MRS

内存不足导致HDFS NameNode启动失败问题背景与现象场景一：重启HDFS服务后，HDFS的状态为Bad，且NameNode实例状态异常，并且很久没有退出安全模式。场景二：NameNode启动时，启动超时后启动失败，原生页面无法打开。原因分析在NameNode运行

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-12037 NTP服务器异常 - MapReduce服务 MRS

检查是否能从NTP服务器获取时间。继续查看告警附加信息，是否提示不能从NTP服务器获取时间。是，执行9。否，执行10。联系NTP服务器的服务商，解决NTP服务器异常。确保NTP服务器正常后检查告警是否恢复。是，处理完毕。否，执行10。检查从NTP服务器获取的时间是否持续未更新。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Presto的coordinator进程无法正常启动 - MapReduce服务 MRS

Presto的coordinator进程无法正常启动用户问题 Presto的coordinator未知原因被终止，或者Presto的coordinator进程无法正常启动。问题现象 Presto的coordinator无法正常启动，Manager页面上显示presto coordinator进程正常启动且状态正常

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Presto
执行join操作时localtask启动失败 - MapReduce服务 MRS

Join，执行MapJoin时会生成localtask任务，localtask启动的jvm内存继承了父进程的内存。当有多个join执行的时候，启动多个localtask，如果机器内存不够，就会导致启动localtask失败。解决办法进入Hive服务配置页面： MRS 3.x

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HetuEngine计算实例启动后状态为故障 - MapReduce服务 MRS

HetuEngine计算实例启动后状态为故障问题启动HetuEngine计算实例后，大约过了30秒，计算实例直接进入故障状态。回答 HetuEngine启动计算实例时，会给Yarn发送命令启动对应的application，若30秒内没有接收到Yarn的响应消息，则因超时结束此次请求。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine故障排除
集群启动Yarn后产生大量作业占用资源 - MapReduce服务 MRS

集群启动Yarn后产生大量作业占用资源问题现象 MRS 2.x及之前版本集群，用户的MRS集群启动Yarn后产生大量作业，占用集群计算资源。原因分析集群安全组入口方向的Any协议源地址配置为0.0.0.0/0，导致集群可能遭受了外部网络攻击。处理步骤登录MRS集群页面，

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Yarn
典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

0.1 Sftp服务器端口 SFTP服务器的端口号。 22 Sftp用户名访问SFTP服务器的用户名。 root Sftp密码访问SFTP服务器的密码。 xxxx Sftp公钥 Sftp服务器公钥。 OdDt/yn...etM 配置多个SFTP服务器，多个服务器指定目录的数据将导入到Hive。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
BE匹配错误IP导致启动失败 - MapReduce服务 MRS

BE匹配错误IP导致启动失败现象描述 BE实例启动失败，报错： backend ip saved in master does not equal to backend local ipx.x.x.x vs. x.x.x.x 原因分析 BE安装节点有多个网卡IP，没有正确设置“

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
MRS集群Core节点扩容成功后部分实例启动失败 - MapReduce服务 MRS

单击“组件管理”，查看各服务的角色操作状态，如果存在“未启动”的角色，单击“更多 > 启动实例”，启动该实例。如果启动失败，根据任务列表里中任务的报错信息进行修复再尝试重启。如果异常角色较多，可单击右上角的“管理操作”选择启动所有组件。如果存在其他情况导致服务异常无法解决，请联系技术服务协助处理。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败问题现象 Manager页面监控发现RegionServer状态为Restoring。原因分析通过查看RegionServer日志（/var/log/Bigdata/hbase/rs/hbase-omm-xxx.log）。使用lsof

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

DBService配置文件丢失导致启动失败问题背景与现象节点异常下电，重启备DBService失败。原因分析查看/var/log/Bigdata/dbservice/DB/gaussdb.log日志没有内容。查看/var/log/Bigdata/dbservice/sc

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败用户问题 MRS的Hive服务故障，重新启动后，Master2节点上的HiveServer和WebHCat进程启动失败，Master1节点进程正常。原因分析登录Master2节点，查看“/var/lo

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

HBase启动后原生页面显示RegionServer个数多于实际个数问题背景 HBase启动后，HMaster原生页面显示RegionServer个数多于实际RegionServer个数。查看HMaster原生页面，显示有4个RegionServer在线，如下图示：原因分析

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

在登录的主机节点上ping第三方AD服务器IP，确认是否能ping通第三方AD服务器。是，执行7。否，执行8。执行以下命令查看是否能连通第三方AD服务。 telnet IP port 其中IP为第三方AD服务器IP地址，port为第三方AD服务器使用端口。是，执行8。否，联系运维人员检查网络。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
如何查询MRS节点的启动时间？ - MapReduce服务 MRS

如何查询MRS节点的启动时间？在MRS服务管理控制台中单击集群名称，进入集群详情页面。在集群节点管理页面中，查看具体节点IP地址信息。登录当前节点，执行如下命令查询节点启动时间。 date -d "$(awk -F. '{print $1}' /proc/uptime) second

帮助中心 > MapReduce服务 MRS > 常见问题 > 节点管理类

总条数： 2363

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

WebHCat健康状态异常导致启动失败 - MapReduce服务 MRS

修改MRS集群NTP服务器 - MapReduce服务 MRS

HDFS上设置配额导致HBase启动失败 - MapReduce服务 MRS

修改hostname后导致WebHCat启动失败 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

内存不足导致HDFS NameNode启动失败 - MapReduce服务 MRS

ALM-12037 NTP服务器异常 - MapReduce服务 MRS

Presto的coordinator进程无法正常启动 - MapReduce服务 MRS

执行join操作时localtask启动失败 - MapReduce服务 MRS

HetuEngine计算实例启动后状态为故障 - MapReduce服务 MRS

集群启动Yarn后产生大量作业占用资源 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到Hive - MapReduce服务 MRS

BE匹配错误IP导致启动失败 - MapReduce服务 MRS

MRS集群Core节点扩容成功后部分实例启动失败 - MapReduce服务 MRS

端口被占用导致RegionServer启动失败 - MapReduce服务 MRS

DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

mapred-default.xml文件解析异常导致WebHCat启动失败 - MapReduce服务 MRS

HBase启动后原生页面显示RegionServer个数多于实际个数 - MapReduce服务 MRS

ALM-12100 AD服务器连接异常 - MapReduce服务 MRS

如何查询MRS节点的启动时间？ - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线