搜索_华为云

HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

HDFS HTTP REST API接口介绍功能简介 REST应用开发代码样例中所涉及的文件操作主要包括创建文件、读写文件、追加文件、删除文件。完整和详细的接口请参考官网上的描述以了解其使用：http://hadoop.apache.org/docs/r2.7.2/hadoop

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发常见问题
Hudi常见配置参数 - MapReduce服务 MRS

Hudi常见配置参数本章节介绍Hudi重要配置的详细信息，更多配置请参考Hudi官网http://hudi.apache.org/cn/docs/configurations.html。写入操作配置表1 写入操作重要配置项参数描述默认值 hoodie.datasource

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
提升HBase非业务高峰期的Compaction执行速度 - MapReduce服务 MRS

提升HBase非业务高峰期的Compaction执行速度操作场景 HBase支持设置非业务高峰期和非高峰期的Compaction吞吐量，通过在非高峰期设置较大的吞吐量，加快Compaction的执行速度，减小高峰期Compaction对业务的影响。该操作仅MRS 3.3.0及之后版本支持。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
Hive应用开发建议 - MapReduce服务 MRS

Hive应用开发建议 HQL编写之隐式类型转换查询语句使用字段的值做过滤时，不建议通过Hive自身的隐式类型转换来编写HQL。因为隐式类型转换不利于代码的阅读和移植。建议示例： select * from default.tbl_src where id = 10001; select

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hive应用开发规范
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。如需使用Hudi，请确保MRS集群内已安装Spark/Spark2x服务。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
使用命令行运行Loader作业 - MapReduce服务 MRS

使用命令行运行Loader作业操作场景一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。 Loader不兼容旧版本客户端，如果重新安装集群或Loader服务，请

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如： rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
使用Scan API读取HBase表数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，建议指定StartRow和StopRow。查询结果的多行数据保存在ResultScan

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化操作场景 Spark SQL中，当对两个表进行join操作时，利用Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
LakeFormation服务概述 - MapReduce服务 MRS

LakeFormation服务概述该LakeFormation入门教程介绍了如何创建一个LakeFormation实例并与MRS集群对接，实现统一的数据湖元数据及权限管理。使用流程简介 MRS与LakeFormation对接的使用流程如下图所示：图1 LakeFormation使用流程

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
准备Hive应用开发用户 - MapReduce服务 MRS

准备Hive应用开发用户开发用户用于运行样例工程。用户需要有Hive权限，才能运行Hive样例工程。前提条件 MRS服务集群开启了Kerberos认证需要执行该步骤，没有开启Kerberos认证的集群忽略该步骤。操作步骤登录MRS Manager，请参考登录MRS Manager。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 准备Hive应用开发环境
Flink Stream SQL Join增强 - MapReduce服务 MRS

Flink Stream SQL Join增强 Flink的Table API&SQL是一种用于Scala和Java的语言集成式查询API，它支持非常直观的从关系运算符（如选择、筛选和连接）进行组合查询。Table API&SQL详细内容请参见官网：https://ci.apache

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
使用Scan API读取HBase表数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，建议指定StartRow和StopRow。查询结果的多行数据保存在ResultScan

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
使用Scan API读取HBase表数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，最好指定StartRow和StopRow。查询结果的多行数据保存在ResultScan

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
准备HDFS应用开发用户 - MapReduce服务 MRS

准备HDFS应用开发用户前提条件 MRS服务集群开启了Kerberos认证，没有开启Kerberos认证的集群忽略该步骤。操作场景开发用户用于运行样例工程。用户需要有HDFS权限，才能运行HDFS样例工程。操作步骤登录MRS Manager，在MRS Manager界面选择“系统设置

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 准备HDFS应用开发环境
使用客户端运行Loader作业 - MapReduce服务 MRS

使用客户端运行Loader作业操作场景一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。 Loader不兼容旧版本客户端，如果重新安装集群或Loader服务，请

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
Flink REST API接口介绍 - MapReduce服务 MRS

Flink REST API接口介绍 Flink具有可用于查询正在运行的作业的状态和统计信息以及最近完成作业的监视API。该监视API由Flink自己的WEB UI使用。监视API是REST API，可接受HTTP GET请求并使用JSON数据进行响应。REST API是访问W

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例： rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

经验总结使用mapPartitions，按每个分区计算结果如果每条记录的开销太大，例 rdd.map{x=>conn=getDBConn;conn.write(x.toString);conn.close} 则可以使用MapPartitions，按每个分区计算结果，如 rdd

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化操作场景 Spark SQL中，当对两个表进行join操作时，利用Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优

总条数： 2223

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

Hudi常见配置参数 - MapReduce服务 MRS

提升HBase非业务高峰期的Compaction执行速度 - MapReduce服务 MRS

Hive应用开发建议 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

使用命令行运行Loader作业 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

LakeFormation服务概述 - MapReduce服务 MRS

准备Hive应用开发用户 - MapReduce服务 MRS

Flink Stream SQL Join增强 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

准备HDFS应用开发用户 - MapReduce服务 MRS

使用客户端运行Loader作业 - MapReduce服务 MRS

Flink REST API接口介绍 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线