搜索_华为云

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

系统选择所有DataNode节点中偏差最多的数据量作为迁移的总数据量。 Balancer的迁移是按迭代（iteration）方式串行顺序处理的，每个iteration迁移数据量不超过10GB，每个iteration重新计算使用率的情况。因此针对集群情况，可以大概估算每个ite

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Spark客户端使用实践 - MapReduce服务 MRS

taken: 0.18 seconds, Fetched 1 row(s) 查看Spark应用运行结果。通过指定文件查看运行结果数据。结果数据的存储路径和格式由Spark应用程序指定。通过Web页面查看运行情况。登录Manager主页面。在服务中选择Spark2x。进入Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
MRS集群用户权限模型 - MapReduce服务 MRS

权限策略中针对资源可配置各种访问条件，例如文件的读写，具体可以配置允许条件、拒绝条件以及例外条件等。权限机制 MRS集群采用LDAP存储用户和用户组的数据；角色的定义信息保存在关系数据库中，角色和权限的对应关系则保存在组件侧。 MRS使用Kerberos进行统一认证。用户权限校验流程大致如下：

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
配置通过ELB访问Doris集群 - MapReduce服务 MRS

详细操作步骤请参考创建共享型负载均衡器。登录华为云管理控制台，在服务列表中选择“网络 > 弹性负载均衡 ELB”。在“负载均衡器”界面右上方单击“购买弹性负载均衡”。在“购买弹性负载均衡”界面，配置以下参数，其他参数保持默认即可：实例类型：选择“共享型”。计费模式：选择“按需计费”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris高可用功能
Flink客户端执行命令报错“Could not connect to the leading JobManager” - MapReduce服务 MRS

timed out after [10000 milliseconds] 可能原因 Flink开启了SSL通信加密，却没有正确的配置SSL证书。解决办法针对MRS 2.x及之前版本，操作如下：方法1：关闭Flink SSL通信加密，修改客户端配置文件“conf/flink-conf

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flink
执行Kafka Topic创建操作时发现无法创建提示“NoNode for /brokers/ids” - MapReduce服务 MRS

--replication-factor 1 --partitions 2 --topic test --zookeeper 192.168.234.231:2181 解决办法保证Kafka服务处于正常状态。创建命令中ZooKeeper地址信息需要添加/kafka。 [root@10-10-144-2 client]#

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
调整集群节点 - MapReduce服务 MRS

data_volume_type 是 String 参数解释： Task节点数据磁盘存储类别，目前支持SATA、SAS和SSD等。约束限制：不涉及取值范围： SATA：普通IO SAS：高IO SSD：超高IO GPSSD：通用型SSD 默认取值：不涉及 data_volume_count 是

 帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
配置Container日志聚合功能 - MapReduce服务 MRS

合理的时间值。 1296000 yarn.log-aggregation.retain-check-interval-seconds 设置扫描HDFS保存的Container聚合日志的间隔时间。单位：秒。设置为-1或0时，间隔时间将为“yarn.log-aggregation.

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
Hudi表模型设计规范 - MapReduce服务 MRS

Hudi表名以及列名采用小写字母。多引擎读写同一张Hudi表时，为了规避引擎之间大小写的支持不同，统一采用小写字母。建议 Spark批处理场景，对写入时延要求不高的场景，采用COW表。 COW表模型中，写入数据存在写放大问题，因此写入速度较慢；但COW具有非常好的读取性能力。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Yarn”。选择“配置 > 全部配置”，搜索参数“yarn.acl.enable”，修改参数值为“true”。如果该参数值已经为“true”，则无需处理。图1 配置参数“yarn.acl.enable” 使用Ranger管理员用户rangeradmin登录Ranger管理页面，具体操作可参考登录Ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger权限策略配置示例
配置Spark Native引擎 - MapReduce服务 MRS

宽的利用率不足，因此存在性能提升空间。使用成熟的向量化的c++加速库后，数据采用向量化格式存在内存中，可以提高带宽利用率，并通过批量的列数处理获得加速效果。通过开启Spark Native引擎特性，获得SparkSQL的性能加速。使用约束 Scan算子当前支持的数据类型为：B

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
修改MRS集群节点机架信息 - MapReduce服务 MRS

x及以后版本。修改集群节点机架信息对系统的影响修改主机机架名称，将影响HDFS的副本存放策略、Yarn的任务分配及Kafka的Partition存储位置。修改后需重启HDFS、Yarn和Kafka，使配置信息生效。不合理的机架配置会导致集群的节点之间的负载（包括CPU、内存、磁盘、网

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点
添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Yarn”。选择“配置 > 全部配置”，搜索参数“yarn.acl.enable”，修改参数值为“true”。如果该参数值已经为“true”，则无需处理。图1 配置参数“yarn.acl.enable” 使用Ranger管理员用户rangeradmin登录Ranger管理页面，具体操作可参考登录Ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
Flume启动失败 - MapReduce服务 MRS
Flume启动失败 - MapReduce服务 MRS

Flume_ClientConfig/JDK/jdk-8u18/bin/java: No such file or directory 解决办法适当调大堆内存（xmx）的值。与正常启动Flume的节点进行文件和文件夹权限对比，更改错误文件或文件夹权限。重新配置JAVA_HOME。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
Spark执行应用时上报“Connection to ip:port has been quiet for xxx ms while there are outstanding requests”并导致应用结束 - MapReduce服务 MRS

channel又达到了过期时间，该channel就被终止了，AM端感知到channel被终止后认为driver失联，然后整个应用停止。解决办法：在Spark客户端的“spark-defaults.conf”文件中或通过set命令行进行设置。参数配置时要保证channel过期时间（spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

规则选择一个队列，再选择队列上的一个应用，并尝试在这个应用上分配资源。若因参数限制导致分配失败，将选择下一个应用。选择一个应用后，调度器会处理此应用的资源申请。其优先级从高到低依次为：本地资源的申请、同机架的申请，任意机器的申请。图2 资源分配模型 YARN原理新的Hadoop

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flume/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数，建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hostname 要发送数据的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flume/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数，建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hostname 要发送数据的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
Flink应用性能调优建议 - MapReduce服务 MRS

keyBy尽量不要使用String。设置并行度并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

plicatedMergeTree引擎表，后续又进行删除表等操作导致ZooKeeper上的数据异常，致使ClickHouse启动失败。解决办法备份问题节点数据库下所有表数据到其他目录。备份表数据： MRS 3.0.5及之前版本 cd /srv/BigData/data1/clickhouse/data/数据库名

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse

总条数： 2982

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

MRS集群用户权限模型 - MapReduce服务 MRS

配置通过ELB访问Doris集群 - MapReduce服务 MRS

Flink客户端执行命令报错“Could not connect to the leading JobManager” - MapReduce服务 MRS

执行Kafka Topic创建操作时发现无法创建提示“NoNode for /brokers/ids” - MapReduce服务 MRS

调整集群节点 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

Hudi表模型设计规范 - MapReduce服务 MRS

添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

修改MRS集群节点机架信息 - MapReduce服务 MRS

添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Flume启动失败 - MapReduce服务 MRS

Spark执行应用时上报“Connection to ip:port has been quiet for xxx ms while there are outstanding requests”并导致应用结束 - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线