搜索_华为云

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

auto.maxDataNodesNum 该参数用来控制进行自动Balancer的DataNode数量。假设该参数值为N，当N大于0，则选择剩余空间比例最高的N个DataNode和最低的N个DataNode之间进行数据均衡；当N等于0，则对集群中所有DataNode进行数据均衡。 5

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

auto.maxDataNodesNum 该参数用来控制进行自动Balancer的DataNode数量。假设该参数值为N，当N大于0，则选择剩余空间比例最高的N个DataNode和最低的N个DataNode之间进行数据均衡；当N等于0，则对集群中所有DataNode进行数据均衡。 5

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

路径，“labelExpression”为标签表达式。开启NodeLabel特性后，可以通过命令hdfs nodelabel -listNodeLabels查看每个DataNode的标签信息。块副本位置选择 NodeLabel支持对各个副本的摆放采用不同的策略，如表达式“label-1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
节点内DataNode磁盘使用率不均衡 - MapReduce服务 MRS

ngPolicy 解决办法将DataNode选择磁盘策略的参数dfs.datanode.fsdataset.volume.choosing.policy的值改为：org.apache.hadoop.hdfs.server.datanode.fsdataset.Available

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
集群出现ALM-14012 Journalnode数据不同步告警 - MapReduce服务 MRS

集群出现ALM-14012 Journalnode数据不同步告警问题背景与现象 MRS集群出现ALM-14012 Journalnode数据不同步告警。原因分析登录告警节点，查找日志路径“/var/log/Bigdata/hdfs/nn”下Journalnode实例的startDetail

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
更改NodeManager的存储目录 - MapReduce服务 MRS

arn.nodemanager.local-dirs”和日志目录“yarn.nodemanager.log-dirs”。适用于以下场景：更改NodeManager角色的存储目录，所有NodeManager实例的存储目录将同步修改。更改NodeManager单个实例的存储目录，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理
修改RPC端口后HDFS NameNode实例都变为备状态 - MapReduce服务 MRS

NameNode实例都变为备状态用户问题通过页面更改NameNode的RPC端口，随后重启HDFS服务，出现所有NameNode一直是备状态，导致集群异常。问题现象所有NameNode都是备状态，导致集群异常。原因分析集群安装启动后，如果修改NameNode的RPC端

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
ALM-14027 DataNode磁盘故障 - MapReduce服务 MRS

ALM-14027 DataNode磁盘故障告警解释系统每60秒周期性检测DataNode节点上的磁盘状况，当检测到有磁盘出现故障时产生该告警。当DataNode上故障磁盘都恢复正常后，手动清除该告警，并重启该DataNode。告警属性告警ID 告警级别是否自动清除 14027

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

路径，“labelExpression”为标签表达式。开启NodeLabel特性后，可以通过命令hdfs nodelabel -listNodeLabels查看每个DataNode的标签信息。块副本位置选择 NodeLabel支持对各个副本的摆放采用不同的策略，如表达式“label-1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
调整DataNode磁盘坏卷信息 - MapReduce服务 MRS

调整DataNode磁盘坏卷信息配置场景在开源版本中，如果为DataNode配置多个数据存放卷，默认情况下其中一个卷损坏，则DataNode将不再提供服务。用户可以通过修改配置项“dfs.datanode.failed.volumes.tolerated”的值，指定失败的个数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
调整DataNode磁盘坏卷信息 - MapReduce服务 MRS

调整DataNode磁盘坏卷信息配置场景在开源版本中，如果为DataNode配置多个数据存放卷，默认情况下其中一个卷损坏，则DataNode将不再提供服务。用户可以通过修改配置项“dfs.datanode.failed.volumes.tolerated”的值，指定失败的个数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
更改NodeManager的存储目录 - MapReduce服务 MRS

arn.nodemanager.local-dirs”和日志目录“yarn.nodemanager.log-dirs”。适用于以下场景：更改NodeManager角色的存储目录，所有NodeManager实例的存储目录将同步修改。更改NodeManager单个实例的存储目录，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
由于HDFS块丢失导致DataNode退服失败 - MapReduce服务 MRS

由于HDFS块丢失导致DataNode退服失败问题背景与现象在退服DataNode过程中，一直提示退服失败。原因分析查看退服失败报错日志，日志中显示总计1564个块，有一个块一直没法被备份。登录集群Master节点，进入HDFS客户端，执行hdfs fsck /命令查看损坏的块，并记录文件路径。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
DataNode概率性出现CPU占用接近100%导致节点丢失 - MapReduce服务 MRS

DataNode写失败的日志短时间内写入大量文件导致这种情况，因此DataNode内存不足。图3 写入大量文件导致DataNode内存不足解决办法检查DataNode内存配置，以及机器剩余内存是否充足。增加DataNode内存，并重启DataNode。父主题：使用HDFS

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
单NameNode长期故障时如何使用客户端手动checkpoint - MapReduce服务 MRS

备NameNode会周期性做合并editlog，生成fsimage文件的过程叫做checkpoint。备NameNode在新生成fsimage后，会将fsimage传递到主NameNode。由于“备NameNode会周期性做合并editlog”，因此当备NameNode异常时，无

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
配置NameNode黑名单功能 - MapReduce服务 MRS

n2。若在任一时刻，所有NameNode都被添加至blacklist，则其内容会被清空，client会按照初始的NameNode list重新尝试连接。若再次出现任何故障，NameNode仍会被添加至blacklist。图1 NameNode blacklisting状态图配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
配置NameNode黑名单功能 - MapReduce服务 MRS

n2。若在任一时刻，所有NameNode都被添加至blacklist，则其内容会被清空，client会按照初始的NameNode list重新尝试连接。若再次出现任何故障，NameNode仍会被添加至blacklist。图1 NameNode blacklisting状态图配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
ALM-14036 NameNode进入安全模式 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响 NameNode进入安全模式后，该NameNode不可写入。可能原因用户手动进入安全模式或重启NameNode时存在丢块。处理步骤检查NameNode节点是否进入安全模式。登录FusionInsight Manager页面，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败问题在JournalNode节点有断电，数据目录磁盘占满，网络异常时，会导致JournalNode上的EditLog不连续。此时如果重启NameNode，很可能会失败。现象重启NameNode会失败。在NameNode运行日志中会报如下的错误：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS故障排除
ALM-14026 DataNode块数超过阈值 - MapReduce服务 MRS

ALM-14026 DataNode块数超过阈值告警解释系统每30秒周期性检测每个DataNode上的块数，当检测到当前的DataNode节点上块数超过阈值时产生该告警。如果平滑次数为1，DataNode节点上的块数小于或等于阈值时，告警恢复；如果平滑次数大于1，DataNode节点上的块数小于或等于阈值的90%时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 2219

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

节点内DataNode磁盘使用率不均衡 - MapReduce服务 MRS

集群出现ALM-14012 Journalnode数据不同步告警 - MapReduce服务 MRS

更改NodeManager的存储目录 - MapReduce服务 MRS

修改RPC端口后HDFS NameNode实例都变为备状态 - MapReduce服务 MRS

ALM-14027 DataNode磁盘故障 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

调整DataNode磁盘坏卷信息 - MapReduce服务 MRS

调整DataNode磁盘坏卷信息 - MapReduce服务 MRS

更改NodeManager的存储目录 - MapReduce服务 MRS

由于HDFS块丢失导致DataNode退服失败 - MapReduce服务 MRS

DataNode概率性出现CPU占用接近100%导致节点丢失 - MapReduce服务 MRS

单NameNode长期故障时如何使用客户端手动checkpoint - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

ALM-14036 NameNode进入安全模式 - MapReduce服务 MRS

EditLog不连续导致NameNode启动失败 - MapReduce服务 MRS

ALM-14026 DataNode块数超过阈值 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线