搜索_华为云

Flink任务开发建议 - MapReduce服务 MRS

Flink任务开发建议高可用性下考虑提高Checkpoint保存数 Checkpoint保存数默认是1，也就是只保存最新的Checkpoint的状态文件，当进行状态恢复时，如果最新的Checkpoint文件不可用（比如HDFS文件所有副本都损坏或者其他原因），那么状态恢复就会失败

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
mapPartitions接口使用 - MapReduce服务 MRS

mapPartitions接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造需要遍历的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

常用参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置参数。配置Stage失败重试次数 Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，推荐Windows 7以上版本。运行环境：Windows或Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 准备HetuEngine应用开发环境
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
配置LakeFormation数据连接前准备 - MapReduce服务 MRS

配置LakeFormation数据连接前准备配置LakeFormation实例登录华为云管理控制台，在左上角单击“”，选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。单击页面右上角“购买实例”，参考创建LakeFormation实例创建

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
配置LakeFormation数据连接前准备 - MapReduce服务 MRS

配置LakeFormation数据连接前准备配置LakeFormation实例登录华为云管理控制台，在左上角单击“”，选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。单击页面右上角“购买实例”，参考创建LakeFormation实例创建

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist()

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。使用Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，推荐Windows 7以上版本。运行环境：Windows或Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
添加HBase数据源 - MapReduce服务 MRS

添加HBase数据源本章节指导用户在HSConsole界面添加HBase数据源。添加HBase数据源前提条件数据源所在集群域名与HetuEngine集群域名不能相同。数据源所在集群与HetuEngine集群节点网络互通。在HetuEngine所在集群的所有节点的“/etc

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源

总条数： 1910

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink任务开发建议 - MapReduce服务 MRS

mapPartitions接口使用 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

配置LakeFormation数据连接前准备 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

配置LakeFormation数据连接前准备 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

添加HBase数据源 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线