搜索_华为云

准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统。运行环境：Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通。安装JDK 开发和运行环境的基本配置。版本要求如下：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 准备Flink应用开发环境
KafkaManager - MapReduce服务 MRS
KafkaManager - MapReduce服务 MRS

支持界面执行分区重新分配（基于生成的分区方案）支持界面选择配置创建主题（支持多种Kafka版本集群）支持界面删除主题（仅0.8.2版本并设置参数“delete.topic.enable = true”的集群支持）支持批量生成多个主题的分区分配，并可选择要使用的分区方案支持批量运行重新分配多个主题的分区

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
为什么运行任务时客户端不可用 - MapReduce服务 MRS

户端会一直处于等待状态。为避免出现上述场景，使用“core-site.xml”中的“ipc.client.rpc.timeout”配置项设置客户端超时时间。该参数的参数值为毫秒。默认值为0，表示无超时。客户端超时的取值范围可以为0～2147483647毫秒。如果Hadoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce常见问题
为什么运行任务时客户端不可用 - MapReduce服务 MRS

户端会一直处于等待状态。为避免出现上述场景，使用“core-site.xml”中的“ipc.client.rpc.timeout”配置项设置客户端超时时间。该参数的参数值为毫秒。默认值为0，表示无超时。客户端超时的取值范围可以为0～2147483647毫秒。如果Hadoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

reduce.shuffle.max-host-failures MR任务在reduce过程中读取远端shuffle数据允许失败的次数。当设置次数大于5时，可以降低客户端应用的失败率。该参数适用于MRS 3.x版本。 5 mapreduce.client.submit.file.replication

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

reduce.shuffle.max-host-failures MR任务在reduce过程中读取远端shuffle数据允许失败的次数。当设置次数大于5时，可以降低客户端应用的失败率。该参数适用于MRS 3.x版本。 5 mapreduce.client.submit.file.replication

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
CarbonData常见问题 - MapReduce服务 MRS

如何在不同的namespaces上逻辑地分割数据为什么在Spark Shell中不能执行更新命令？如何在CarbonData中配置非安全内存？设置了HDFS存储目录的磁盘空间配额，CarbonData为什么会发生异常？为什么数据查询/加载失败，且发生“org.apache.carbondata

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
Python样例代码 - MapReduce服务 MRS

print "Usage: CollectFemaleInfo <file>" exit(-1) # 创建SparkContext，设置AppName sc = SparkContext(appName = "CollectFemaleInfo")? """ 以下程序主要实现以下几步功能：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据操作场景 Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。 Spark On HBase 登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取HIVE分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取Hive分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
distinct聚合优化 - MapReduce服务 MRS

配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct.expandThreshold 由cube等引起的数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Hudi数据表Compaction规范 - MapReduce服务 MRS

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
管理MRS集群备份恢复任务 - MapReduce服务 MRS

打开任务运行日志窗口，查看运行详细情况以及备份路径。 “查看” 检查恢复任务的参数设置。 “执行” 运行恢复任务。查看备份恢复任务（MRS 2.x及之前版本）在MRS Manager，单击“系统设置”。单击“备份管理”或“恢复管理”。在任务列表中，查看“当次任务进度”列获取

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
Kafka Old Consumer API使用样例 - MapReduce服务 MRS

kafka.example.Old_Consumer类中，作用在于订阅指定Topic的消息。（注意：旧Consumer API仅支持访问未设置ACL的Topic，安全接口说明见Kafka安全接口介绍）样例代码 Old Consumer API线程run方法中的消费逻辑。 /**

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
SELECT查询表数据 - MapReduce服务 MRS

format] 使用示例 --查看ClickHouse集群信息 select * from system.clusters; --显示当前节点设置的宏 select * from system.macros; --查看数据库容量 select sum(rows) as "总行数",

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse常用SQL语法
Hudi数据表Archive规范 - MapReduce服务 MRS

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
获取MRS应用开发样例工程 - MapReduce服务 MRS

获取MRS应用开发样例工程 MRS样例工程构建流程 MRS样例工程构建流程包括三个主要步骤：下载样例工程的Maven工程源码和配置文件，请参见样例工程获取地址。配置华为镜像站中SDK的Maven镜像仓库，请参见配置华为开源镜像仓。根据用户自身需求，构建完整的Maven工程并进行编译开发。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x）

总条数： 3190

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备本地应用开发环境 - MapReduce服务 MRS

KafkaManager - MapReduce服务 MRS

为什么运行任务时客户端不可用 - MapReduce服务 MRS

为什么运行任务时客户端不可用 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

降低MapReduce客户端运行任务失败率 - MapReduce服务 MRS

CarbonData常见问题 - MapReduce服务 MRS

Python样例代码 - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

distinct聚合优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

管理MRS集群备份恢复任务 - MapReduce服务 MRS

Kafka Old Consumer API使用样例 - MapReduce服务 MRS

SELECT查询表数据 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线