搜索_华为云

自动弹性伸缩 - MapReduce服务 MRS

成集群的扩缩容，避免出现增加或减少资源的延后。弹性伸缩规则与资源计划均可触发弹性伸缩，两者既可同时配置也可单独配置。资源计划与基于负载的弹性伸缩规则叠加使用可以使得集群节点的弹性更好，足以应对偶尔超出预期的数据峰值出现。当某些业务场景要求在集群扩缩容之后，根据节点数量的变化对

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
Flume业务模型配置说明 - MapReduce服务 MRS

lume内建拦截器的类名列表，也可以开发自定义的拦截器来实现Event的修改或丢弃。Flume内建支持的拦截器如下表所示，本章节会选取一个较为复杂的作为示例。其余的用户可以根据需要自行配置使用。拦截器用在Flume的Source、Channel之间，大部分的Source都带有I

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Spark REST API接口介绍 - MapReduce服务 MRS

Spark REST API接口介绍功能简介 Spark的REST API以JSON格式展现Web UI的一些指标，提供用户一种更简单的方法去创建新的展示和监控的工具，并且支持查询正在运行的app和已经结束的app的相关信息。开源的Spark REST接口支持对Jobs、Stages

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

store以及数据库，支持对于可变状态的细粒度更新，这一点要求集群需要对数据或者日志的更新进行备份来保障容错性。这样就会给数据密集型的工作流带来大量的IO开销。而对于RDD来说，它只有一套受限制的接口，仅支持粗粒度的更新，例如map，join等等。通过这种方式，Spark只需要简单的记录建立数据的转换操作的

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
快速使用Hadoop - MapReduce服务 MRS

快速使用Hadoop 本章节提供从零开始使用Hadoop提交wordcount作业的操作指导，wordcount是最经典的Hadoop作业，它用来统计海量文本的单词数量。操作步骤准备wordcount程序。开源的Hadoop的样例程序包含多个例子，其中包含wordcount。可以从https://dist

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

/#files。将下载的setuptools压缩文件复制到客户端机器上，解压后进入setuptools项目目录，在客户端机器的命令行终端执行python3 setup.py install。以47.3.1版本为例，如下内容表示安装setuptools的47.3.1版本成功。 Finished

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
快速使用Hive进行数据分析 - MapReduce服务 MRS

快速使用Hive进行数据分析 Hive是基于Hadoop的一个数据仓库工具，可将结构化的数据文件映射成一张数据库表，并提供类SQL的功能对数据进行分析处理，通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。背景信息假定用户开发一

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

行部署，且无需依赖安装中复制的静态版本。因此，可以在HDFS中存放多版本的Hadoop，并通过配置“mapred-site.xml”文件指定任务默认使用的版本。只需设置适当的配置属性，用户就可以运行不同版本的MapReduce，而无需使用部署在集群中的版本。图1 具有多个版本N

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
快速使用Hadoop - MapReduce服务 MRS

快速使用Hadoop 本章节提供从零开始使用Hadoop提交wordcount作业的操作指导，wordcount是最经典的Hadoop作业，它用来统计海量文本的单词数量。操作步骤准备wordcount程序。开源的Hadoop的样例程序包含多个例子，其中包含wordcount。可以从https://dist

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

前提条件集群安装了Spark及Hive服务。执行数据导入的用户需要同时具有Spark（对应源表的SELECT权限）、HBase权限（对应HBase NameSpace的RWXA权限）和HDFS权限（对应HFile输出目录的读写权限）。如果集群已启用Kerberos认证（安全模式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

） jar包 Oozie的share HDFS的“/user/oozie/share/lib/spark2x”目录说明：请执行su - oozie切换到oozie用户，使用oozie用户上传文件。上传结束后再重启Oozie服务。将待使用样例工程的项目打包成jar包 jar包

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用
使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

Oozie的share HDFS的“/user/oozie/share/lib/spark2x”目录说明：请使用Oozie用户上传文件，执行su - oozie切换到Oozie用户上传结束后再重启oozie服务。将待使用样例工程的项目打包成jar包 jar包 HDFS的“/u

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 开发Oozie应用
配置Spark Native引擎 - MapReduce服务 MRS

Native引擎是通过使用向量化的C++加速库，实现对Spark算子性能加速的一种技术方案。传统的SparkSQL是基于行式数据，通过JVM的codegen来实现查询加速的，由于JVM对生成的java代码存在各种约束，比如方法长度，参数个数等，以及行式数据对内存带宽的利用率不足，因此存在性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置HBase数据压缩格式和编码 - MapReduce服务 MRS

如果集群开启了Kerberos认证，操作的用户还需要具备对应的操作权限。即创建表时需要具备对应的namespace或更高级别的创建（C）或者管理（A）权限，修改表时需要具备已创建的表或者更高级别的创建（C）或者管理（A）权限。具体的授权操作请参考创建HBase权限角色章节。配置HBase数据压缩格式和编码

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
配置HBase数据压缩格式和编码 - MapReduce服务 MRS

如果集群开启了Kerberos认证，操作的用户还需要具备对应的操作权限。即创建表时需要具备对应的namespace或更高级别的创建（C）或者管理（A）权限，修改表时需要具备已创建的表或者更高级别的创建（C）或者管理（A）权限。具体的授权操作请参考创建HBase权限角色章节。配置HBase数据压缩格式和编码

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase数据操作
HDFS文件系统目录简介 - MapReduce服务 MRS

HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件之后的添加操作。HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
创建SparkSQL角色 - MapReduce服务 MRS

限，可设置与管理已创建的表的数据操作权限。 Hive角色管理支持授予Hive管理员权限、访问表和视图的权限，不支持数据库的授权。 Hive管理员权限不支持管理HDFS的权限。如果数据库中的表或者表中的文件数量比较多，在授权时可能需要等待一段时间。例如表的文件数量为1万时，可能需要等待2分钟。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
Oozie应用开发步骤 - MapReduce服务 MRS

Oozie应用开发步骤业务分析。可以使用客户端样例目录中MapReduce程序对日志目录的数据进行分析、处理。将MapReduce程序的分析结果移动到数据分析结果目录，并将数据文件的权限设置成660。为了满足每天分析一次的需求，需要每天重复执行一次1.a～1.b。业务实现。登录Oozie客

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 开发Oozie应用 > 开发Oozie配置文件

总条数： 3484

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动弹性伸缩 - MapReduce服务 MRS

Flume业务模型配置说明 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

快速使用Hadoop - MapReduce服务 MRS

导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

快速使用Hive进行数据分析 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

快速使用Hadoop - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

使用Oozie调度Spark2x访问HBase以及Hive - MapReduce服务 MRS

使用Oozie调度Spark访问HBase以及Hive - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

配置HBase数据压缩格式和编码 - MapReduce服务 MRS

配置HBase数据压缩格式和编码 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

创建SparkSQL角色 - MapReduce服务 MRS

Oozie应用开发步骤 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线