搜索_华为云

运行MapReduce作业 - MapReduce服务 MRS

运行MapReduce作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个MapReduce作业。 MapReduce作业用于提交Hadoop jar程序快速并行处理大量数据，是一种分布式数据处理模式。用户可以在MRS管理控制台在线创建一个作业并提交运行

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
通过数据应用访问Alluxio - MapReduce服务 MRS

通过数据应用访问Alluxio 访问Alluxio文件系统的端口号是19998，即地址为alluxio://<alluxio的master节点ip>:19998/<PATH>，本节将通过示例介绍如何通过数据应用（Spark、Hive、Hadoop MapReduce和Presto）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Alluxio
HBase本地二级索引介绍 - MapReduce服务 MRS

HBase本地二级索引介绍场景介绍 HBase是基于Key-Value的分布式存储数据库，基于rowkeys对表中的数据按照字典进行排序。如果您根据指定的rowkey查询数据，或者扫描指定rowkey范围内的数据，HBase可以快速查找到需要读取的数据，从而提高效率。在大多数实际情况下

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
添加MRS子租户 - MapReduce服务 MRS

添加MRS子租户根据业务对资源消耗以及隔离的规划与需求，用户可以通过MRS创建子租户，将当前租户的资源进一步分配以满足实际使用场景。如果在添加租户时，租户资源类型选择“非叶子租户”，则支持添加子租户；如果选择“叶子租户”则不支持添加子租户。前提条件已参考添加MRS租户添加“

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
更新客户端（3.x之前版本） - MapReduce服务 MRS

更新客户端（3.x之前版本）本章节适用于MRS 3.x之前版本的集群。MRS 3.x及之后版本，请参考更新客户端（3.x及之后版本）。更新客户端配置文件操作场景 MRS集群提供了客户端，可以在连接服务端、查看任务结果或管理数据的场景中使用。用户使用MRS的客户端时，如果在MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
批量写入Hudi表 - MapReduce服务 MRS

批量写入Hudi表操作场景 Hudi提供多种写入方式，具体见hoodie.datasource.write.operation配置项，这里主要介绍UPSERT、INSERT和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
批量写入Hudi表 - MapReduce服务 MRS

批量写入Hudi表操作场景 Hudi提供多种写入方式，具体见hoodie.datasource.write.operation配置项，这里主要介绍UPSERT、INSERT和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Hive应用开发规则 - MapReduce服务 MRS

Hive应用开发规则 Hive JDBC驱动的加载客户端程序以JDBC的形式连接HiveServer时，需要首先加载Hive的JDBC驱动类org.apache.hive.jdbc.HiveDriver。故在客户端程序的开始，必须先使用当前类加载器加载该驱动类。如果classpath

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hive应用开发规范
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
使用Loader导出数据 - MapReduce服务 MRS

使用Loader导出数据操作场景该任务指导用户完成将数据从MRS导出到外部的数据源的工作。一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。前提条件创建或获取该任务中创建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
使用Loader导出MRS集群内数据 - MapReduce服务 MRS

使用Loader导出MRS集群内数据操作场景该任务指导用户完成将数据从MRS导出到外部的数据源的工作。一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以外的客户端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
添加MySQL数据源 - MapReduce服务 MRS

添加MySQL数据源本章节适用于MRS 3.3.0及之后的版本。 HetuEngine支持配置MySQL数据源实现对MySQL数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加MySQL类型的JDBC数据源。添加MySQL数据源前提条件数据源与HetuEngine

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Flink Stream SQL Join Java样例代码 - MapReduce服务 MRS

Flink Stream SQL Join Java样例代码功能简介在Flink应用中，调用flink-connector-kafka模块的接口，生产并消费数据。用户在开发前需要使用对接安全模式的Kafka，则需要引入MRS的kafka-client-xx.x.x.jar，该

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > Stream SQL Join程序
备份Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

备份Manager数据（MRS 3.x及之后版本）操作场景为了确保FusionInsight Manager系统日常数据安全，或者系统管理员需要对Manager进行重大操作（如扩容、减容等）前后，需要对Manager数据进行备份，从而保证系统在出现异常或未达到预期结果时可以及时进行数据恢复

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
运行SparkSubmit作业 - MapReduce服务 MRS

运行SparkSubmit作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSubmit作业。 Spark是一个开源的并行数据处理框架，能够帮助用户简单、快速的开发，统一的大数据应用，对数据进行离线处理、流式处理、交互式分析等

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
重启MRS集群组件 - MapReduce服务 MRS

重启MRS集群组件在修改了大数据组件的配置项后，需要重启对应的组件来使得配置生效，使用普通重启方式会并发重启所有服务或实例，可能引起业务中断。为了确保服务重启过程中，尽量减少或者不影响业务运行，可以通过滚动重启来按批次重启服务或实例（对于有主备状态的实例，会先重启备实例，再重启主实例

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理企业中的使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
安装客户端（2.x及之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致

 帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端

总条数： 1943

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行MapReduce作业 - MapReduce服务 MRS

通过数据应用访问Alluxio - MapReduce服务 MRS

HBase本地二级索引介绍 - MapReduce服务 MRS

添加MRS子租户 - MapReduce服务 MRS

更新客户端（3.x之前版本） - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

Hive应用开发规则 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

使用Loader导出数据 - MapReduce服务 MRS

使用Loader导出MRS集群内数据 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

添加MySQL数据源 - MapReduce服务 MRS

Flink Stream SQL Join Java样例代码 - MapReduce服务 MRS

备份Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

重启MRS集群组件 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线