搜索_华为云

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

系统选择所有DataNode节点中偏差最多的数据量作为迁移的总数据量。 Balancer的迁移是按迭代（iteration）方式串行顺序处理的，每个iteration迁移数据量不超过10GB，每个iteration重新计算使用率的情况。因此针对集群情况，可以大概估算每个ite

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

系统选择所有DataNode节点中偏差最多的数据量作为迁移的总数据量。 Balancer的迁移是按迭代（iteration）方式串行顺序处理的，每个iteration迁移数据量不超过10GB，每个iteration重新计算使用率的情况。因此针对集群情况，可以大概估算每个ite

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Hudi表模型设计规范 - MapReduce服务 MRS

Hudi表名以及列名采用小写字母。多引擎读写同一张Hudi表时，为了规避引擎之间大小写的支持不同，统一采用小写字母。建议 Spark批处理场景，对写入时延要求不高的场景，采用COW表。 COW表模型中，写入数据存在写放大问题，因此写入速度较慢；但COW具有非常好的读取性能力。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Yarn”。选择“配置 > 全部配置”，搜索参数“yarn.acl.enable”，修改参数值为“true”。如果该参数值已经为“true”，则无需处理。图1 配置参数“yarn.acl.enable” 使用Ranger管理员用户rangeradmin登录Ranger管理页面，具体操作可参考登录Ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Ranger > Ranger权限策略配置示例
compaction&cleaning配置 - MapReduce服务 MRS

10 hoodie.parquet.small.file.limit 该值应小于maxFileSize，如果将其设置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Yarn”。选择“配置 > 全部配置”，搜索参数“yarn.acl.enable”，修改参数值为“true”。如果该参数值已经为“true”，则无需处理。图1 配置参数“yarn.acl.enable” 使用Ranger管理员用户rangeradmin登录Ranger管理页面，具体操作可参考登录Ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

execute(QueryExecutorImpl.java:346) 回答带有分区条件的查询，Hiveserver会对分区进行优化。避免全表扫描，需要查询元数据符合条件的所有分区。而gaussDB中提供的接口sendOneQuery，调用的sendParse方法中对参数的限制为32767。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
HDFS文件读写时报错“Failed to place enough replicas” - MapReduce服务 MRS

java.lang.Thread.run(Thread.java:745) DataNode的磁盘空间不足。 DataNode的心跳有延迟。解决办法如果DataNode的数据接收器不可用，通过在Manager页面，增加HDFS参数“dfs.datanode.max.transfer

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
HDFS写文件失败，报错“item limit of xxx is exceeded” - MapReduce服务 MRS

max-directory-items参数，定义单个目录下不含递归的最大目录数或者文件数，默认值1048576，取值范围1～6400000。解决办法确认该目录不含递归拥有100万以上文件目录是否正常，如果正常，可以将HDFS的参数dfs.namenode.fs-limits.max

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
Flink应用性能调优建议 - MapReduce服务 MRS

keyBy尽量不要使用String。设置并行度并行度控制任务的数量，影响操作后数据被切分成的块数。调整并行度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
ClickHouse普通物化视图设计 - MapReduce服务 MRS

mv1，与物化视图绑定。用于数据预聚合的物化视图，聚合表使用聚合引擎。如果不用聚合引擎，则每次数据插入，会对明细表的全量数据重新计算，而不是只处理增量数据。聚合表中，聚合指标定义成聚合类型（AggregateFunction）。物化视图的指标列与聚合表中对应字段名称一致，命名规范如下：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse物化视图设计
HBase应用开发建议 - MapReduce服务 MRS

er计算出恰好要转移这个Region，那么，这个Region将无法被关闭，本次转移操作将无法完成（关于这个问题，在当前的HBase版本中的处理的确还欠缺妥当）。因此，暂时不建议使用该方法关闭一个Region。采用PutList模式写数据 Table类中提供了两种写数据的接口：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HBase应用开发规范
配置Spark Native引擎 - MapReduce服务 MRS

宽的利用率不足，因此存在性能提升空间。使用成熟的向量化的c++加速库后，数据采用向量化格式存在内存中，可以提高带宽利用率，并通过批量的列数处理获得加速效果。通过开启Spark Native引擎特性，获得SparkSQL的性能加速。使用约束 Scan算子当前支持的数据类型为：B

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
合并CarbonData表Segments - MapReduce服务 MRS

（.carbonindexmerge）。这增强了首次查询性能。参考信息建议避免对历史数据进行minor compaction，请参考如何避免对历史数据进行minor compaction？父主题： CarbonData数据分析

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

plicatedMergeTree引擎表，后续又进行删除表等操作导致ZooKeeper上的数据异常，致使ClickHouse启动失败。解决办法备份问题节点数据库下所有表数据到其他目录。备份表数据： MRS 3.0.5及之前版本 cd /srv/BigData/data1/clickhouse/data/数据库名

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
合并CarbonData表Segments - MapReduce服务 MRS

（.carbonindexmerge）。这增强了首次查询性能。参考信息建议避免对历史数据进行minor compaction，请参考如何避免对历史数据进行minor compaction？父主题： CarbonData数据分析

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

进入到其他ClickHouse节点也发现了同样的报错日志，由此可知Kafka消息堆积是因为ClickHouse解析Kafka数据时出现异常。解决办法使用以下命令修改表的“kafka_skip_broken_messages”属性： # ALTER test.user_log MODIFY

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flume/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数，建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hostname 要发送数据的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

规则选择一个队列，再选择队列上的一个应用，并尝试在这个应用上分配资源。若因参数限制导致分配失败，将选择下一个应用。选择一个应用后，调度器会处理此应用的资源申请。其优先级从高到低依次为：本地资源的申请、同机架的申请，任意机器的申请。图2 资源分配模型 YARN原理新的Hadoop

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

/srv/BigData/hadoop/data1/flume/checkpoint transactionCapacity 事务大小：即当前channel支持事务处理的事件个数，建议和Source的batchSize设置为同样大小，不能小于batchSize。 61200 hostname 要发送数据的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务

总条数： 2362

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

Hudi表模型设计规范 - MapReduce服务 MRS

添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

添加Yarn的Ranger访问权限策略 - MapReduce服务 MRS

Hive使用WHERE条件查询超过3.2万分区的表报错 - MapReduce服务 MRS

HDFS文件读写时报错“Failed to place enough replicas” - MapReduce服务 MRS

HDFS写文件失败，报错“item limit of xxx is exceeded” - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

ClickHouse普通物化视图设计 - MapReduce服务 MRS

HBase应用开发建议 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

合并CarbonData表Segments - MapReduce服务 MRS

ClickHouse消费Kafka数据异常 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线