搜索_华为云

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

常用参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置参数。配置Stage失败重试次数 Spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，推荐Windows 7以上版本。运行环境：Windows或Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 准备HetuEngine应用开发环境
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
配置LakeFormation数据连接前准备 - MapReduce服务 MRS

配置LakeFormation数据连接前准备配置LakeFormation实例登录华为云管理控制台，在左上角单击“”，选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。单击页面右上角“购买实例”，参考创建LakeFormation实例创建

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDFS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程操作场景 Flink针对多个场景提供样例工程，包含Java样例工程和Scala样例工程等，帮助客户快速学习Flink工程。针对Java和Scala不同语言的工程，其导入方式相同。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
配置LakeFormation数据连接前准备 - MapReduce服务 MRS

配置LakeFormation数据连接前准备配置LakeFormation实例登录华为云管理控制台，在左上角单击“”，选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。单击页面右上角“购买实例”，参考创建LakeFormation实例创建

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist()

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
MRS 3.1.0补丁说明 - MapReduce服务 MRS

MRS 3.1.0补丁说明 MRS 3.1.0.0.15补丁基本信息表1 补丁基本信息补丁号 MRS 3.1.0.0.15 发布时间 2024-6-7 补丁约束如果之前集群安装过MRS_3.1.0_HBase_patch_20220929.tar.gz 、MRS_3.1.0_

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
MRS集群数据备份恢复简介 - MapReduce服务 MRS

MRS集群数据备份恢复简介 MRS集群数据备份恢复概述 Manager提供对集群内的用户数据及系统数据的备份恢复能力，备份功能按组件提供。系统支持备份Manager的数据、组件元数据及业务数据。 MRS 3.x及之后版本，备份功能支持将数据备份至本地磁盘（LocalDir）、本端HDFS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。使用Flink

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
准备本地应用开发环境 - MapReduce服务 MRS

准备本地应用开发环境准备开发环境在进行应用开发时，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，推荐Windows 7以上版本。运行环境：Windows或Linux系统。如需在本地调测程序，运行环境需要和集群业务平面网络互通

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Flume常用配置参数 - MapReduce服务 MRS

Flume常用配置参数 MRS 3.x之前版本需在“properties.properties”文件中配置。 MRS 3.x及之后版本，部分参数可在Manager界面配置。基本介绍使用Flume需要配置Source、Channel和Sink，各模块配置参数说明可通过本节内容了解

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume

总条数： 2033

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

配置LakeFormation数据连接前准备 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

配置LakeFormation数据连接前准备 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

MRS 3.1.0补丁说明 - MapReduce服务 MRS

MRS集群数据备份恢复简介 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

Flume常用配置参数 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线