搜索_华为云

残留进程导致Regionsever启动失败 - MapReduce服务 MRS

| grep HRegionServer发现确实存在一个残留的进程。确认进程可以终止后，使用kill命令终止该进程（如果kill无法终止该进程，需要使用kill -9来强制终止该进程）。重新启动HBase服务成功。父主题：使用HBase

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase
HiveServer和HiveHCat进程故障 - MapReduce服务 MRS

HiveServer和HiveHCat进程故障用户问题客户集群HiveServer和WebHCat进程状态均为故障。问题现象客户MRS集群Master2节点上的HiveServer和WebHCat进程状态显示为故障，重启之后仍为故障状态。原因分析在Manager界面单

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
Kafka Broker上报进程异常，日志提示“IllegalArgumentException” - MapReduce服务 MRS

Kafka Broker上报进程异常，日志提示“IllegalArgumentException” 问题背景与现象使用Manager提示进程故障告警，查看告警进程为Kafka Broker。可能原因 Broker配置异常。原因分析在Manager页面，在告警页面得到主机信息。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
Presto的coordinator进程无法正常启动 - MapReduce服务 MRS

Presto的coordinator进程无法正常启动用户问题 Presto的coordinator未知原因被终止，或者Presto的coordinator进程无法正常启动。问题现象 Presto的coordinator无法正常启动，Manager页面上显示presto coordinator进程正常启动

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Presto
ALM-12104 knox资源异常 - MapReduce服务 MRS

产生告警的角色名称。主机名产生告警的主机名。对系统的影响上层服务通过knox下发的请求无法正常处理响应。可能原因 knox进程异常。处理步骤检查knox进程是否异常。登录FusionInsight Manager页面，在告警列表中，单击此告警所在行的，查看该告警的主机名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

|sort -n |uniq -c |sort -n 执行后结果如下：查看启动线程数最多的进程，案例中进程2346为NameNode进程，启动了5.4万线程，且持续增长。多次打印对应进程的jstack日志，根据jstack日志信息发现，NameNode存在大量线程处于WAITING，且长期不释放。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
集群运维 - MapReduce服务 MRS
集群运维 - MapReduce服务 MRS

集群运维告警管理 MRS可以实时监控大数据集群，通过告警和事件可以识别系统健康状态。同时MRS也支持用户自定义配置监控与告警阈值用于关注各指标的健康情况，当监控数据达到告警阈值，系统将会触发一条告警信息。 MRS还可以与华为云消息通知服务(SMN)的消息服务系统对接，将告警信息

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
ALM-45481 KuduTserver存在容量已满磁盘 - MapReduce服务 MRS

ALM-45481 KuduTserver存在容量已满磁盘系统每60秒周期性检测Kudu的磁盘监控指标，当检测到某个Tserver的容量已满磁盘数量监控指标不为0时，产生该告警。当Tserver的容量已满磁盘数量监控指标重新变为0后，该告警自动消除。告警属性告警ID 告警级别是否自动清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
OpenTSDB应用开发简介 - MapReduce服务 MRS

nTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性。 OpenTSDB使用场景有如下几个特点：采集指标在某一时间点具有唯一值，没有复杂的结构及关系。监控的指标具有随着时间不断变化的特点。具有HBase的高吞吐，良好的伸缩性等特点。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发概述
使用jstack命令查看进程堆栈提示“well-known file is not secure” - MapReduce服务 MRS

原因分析由于执行命令的用户与当前查看pid信息的进程提交用户不一致导致。 Storm引入区分用户执行任务特性，在启动worker进程时将给进程的uid和gid改为提交用户和ficommon，目的是为了logviewer可以访问到worker进程的日志同时日志文件只开放权限到640。这样

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
如何调整MRS集群manager-executor进程内存？ - MapReduce服务 MRS

重启manager-executor进程，该进程在Master1和Master2节点上为主备部署，同一时刻只有一个节点上运行该进程，首先确认节点上是否有该进程，如果有该进程则进行重启操作。分别登录Master1节点和Master2节点，执行以下命令确认当前节点是否存在该进程。当有输出时则进程存在。 ps

帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
ALM-14033 ZKFC进程状态异常 - MapReduce服务 MRS

产生告警的主机名。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45444 ClickHouse进程异常 - MapReduce服务 MRS

ALM-45444 ClickHouse进程异常告警解释 ClickHouse实例健康检查模块30秒检查一次，如果连续失败的次数超过配置的阈值，则触发上报告警，此时ClickHouse进程可能处于停止响应状态，无法正常执行业务。告警属性告警ID 告警级别是否可自动清除 45444

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
为什么Driver进程不能退出 - MapReduce服务 MRS

ontext，而不是退出当前进程。如果当前进程中存在其他常驻的线程（类似spark-shell需要不断检测命令输入，Spark Streaming不断在从数据源读取数据），SparkContext被停止并不会终止整个进程。如果需要退出Driver进程，建议使用kill -9 pid命令手动退出当前Driver。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Executor进程Crash导致Stage重试 - MapReduce服务 MRS

Executor进程Crash导致Stage重试问题在执行大数据量的Spark任务（如100T的TPCDS测试套）过程中，有时会出现Executor丢失从而导致Stage重试的现象。查看Executor的日志，出现“Executor 532 is lost rpc with driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

0个map和10000个reduce，任务失败。回答 ZooKeeper IO瓶颈观测手段：通过Manager的监控页面查看单个节点上ZooKeeper请求监控，判断是否严重超出规格限制。通过观测ZooKeeper的日志以及HBase的日志，查看是否有大量的IO Exception

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase故障排除
ALM-14035 HttpFS进程状态异常 - MapReduce服务 MRS

产生告警的主机名。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45294 RangerKMS进程状态异常 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态，或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14031 DataNode进程状态异常 - MapReduce服务 MRS

产生告警的主机名。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14034 Router进程状态异常 - MapReduce服务 MRS

产生告警的主机名。对系统的影响进程状态异常会导致该进程无法提供正常服务，进而可能导致服务整体异常。可能原因主机中正在等待的IO（磁盘IO、网络IO等）在较长时间内未得到响应，进程处于D状态和Z状态。或进程可能被挂起进入T状态。处理步骤查看进程是否处于D、Z、T状态登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1044

上一页
1
2
3
4
5
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

残留进程导致Regionsever启动失败 - MapReduce服务 MRS

HiveServer和HiveHCat进程故障 - MapReduce服务 MRS

Kafka Broker上报进程异常，日志提示“IllegalArgumentException” - MapReduce服务 MRS

Presto的coordinator进程无法正常启动 - MapReduce服务 MRS

ALM-12104 knox资源异常 - MapReduce服务 MRS

NameNode节点存在ALM-12027主机PID使用率超过阈值告警 - MapReduce服务 MRS

集群运维 - MapReduce服务 MRS

ALM-45481 KuduTserver存在容量已满磁盘 - MapReduce服务 MRS

OpenTSDB应用开发简介 - MapReduce服务 MRS

使用jstack命令查看进程堆栈提示“well-known file is not secure” - MapReduce服务 MRS

如何调整MRS集群manager-executor进程内存？ - MapReduce服务 MRS

ALM-14033 ZKFC进程状态异常 - MapReduce服务 MRS

ALM-45444 ClickHouse进程异常 - MapReduce服务 MRS

为什么Driver进程不能退出 - MapReduce服务 MRS

Executor进程Crash导致Stage重试 - MapReduce服务 MRS

有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

ALM-14035 HttpFS进程状态异常 - MapReduce服务 MRS

ALM-45294 RangerKMS进程状态异常 - MapReduce服务 MRS

ALM-14031 DataNode进程状态异常 - MapReduce服务 MRS

ALM-14034 Router进程状态异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线