搜索_华为云

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取SFTP

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
HBase Phoenix API接口介绍 - MapReduce服务 MRS

HBase Phoenix API接口介绍版本关系若使用Phoenix，需下载与当前使用MRS集群相对应的Phoenix版本，具体请参见http://phoenix.apache.org。其对应关系如表1所示：表1 MRS与Phoenix版本对应关系一览表 MRS版本 Phoenix

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发常见问题 > HBase接口介绍
使用Kafka流控工具限制生产消费速度 - MapReduce服务 MRS

使用Kafka流控工具限制生产消费速度操作场景该任务指导用户根据业务需求，在客户端使用命令行工具kafka-configs.sh来管理Kafka集群的配置，按照不同的级别（topic级别、用户级别、客户端级别等）来限制Kafka消息生产和消费速度。该功能仅适用于MRS 3.3.1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris 应用场景通过Doris创建Catalog成功读取RDS-MySQL数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
创建Hive角色 - MapReduce服务 MRS
创建Hive角色 - MapReduce服务 MRS

创建Hive角色操作场景该任务指导MRS集群管理员在Manager创建并设置Hive的角色。Hive角色可设置Hive管理员权限以及Hive数据表的数据操作权限。用户使用Hive并创建数据库需要加入hive组，不需要角色授权。用户在Hive和HDFS中对自己创建的数据库或表拥有完整权限

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive用户权限管理
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 Spark BulkLoad工具支持快速同步Hive或Spark表数据到HBase表中，支持全量或增量导入ORC/PAQUET等格式的表数据。使用Spark BulkLoad同步数据类型数据到HBase表中时，存在以下限制

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
编译并调测Flink应用 - MapReduce服务 MRS

编译并调测Flink应用操作场景在程序代码完成开发后，建议您上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Flink客户端的运行步骤是一样的。基于YARN集群的Flink应用程序不支持在Windows环境下运行，只支持在Linux环境下运行

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 调测Flink应用
离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris 应用场景通过Broker Load将ORC格式的Hive表数据导入到Doris。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
Flux开发指引 - MapReduce服务 MRS
Flux开发指引 - MapReduce服务 MRS

Flux开发指引操作场景本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm 0.10.0版本提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发常见问题
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > HBase应用开发常见问题
HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

HDFS HTTP REST API接口介绍功能简介 REST应用开发代码样例中所涉及的文件操作主要包括创建文件、读写文件、追加文件、删除文件。完整和详细的接口请参考官网上的描述以了解其使用：http://hadoop.apache.org/docs/r3.1.1/hadoop-project-dist

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > HDFS应用开发常见问题 > HDFS常用API介绍
CDL数据集成概述 - MapReduce服务 MRS

CDL数据集成概述 CDL是一种简单、高效的数据实时集成服务，能够从各种OLTP数据库中抓取Data Change事件，然后推送至Kafka中，最后由Sink Connector消费Topic中的数据并导入到大数据生态软件应用中，从而实现数据的实时入湖。 CDL服务包含了两个重要的角色

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
SparkSQL用户权限介绍 - MapReduce服务 MRS

SparkSQL用户权限介绍 SparkSQL权限类似于Hive，SparkSQL也是建立在Hadoop上的数据仓库框架，提供类似SQL的结构化数据。 MRS提供用户、用户组和角色，集群中的各类权限需要先授予角色，然后将用户或者用户组与角色绑定。用户只有绑定角色或者加入绑定角色的用户组

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

创建集群功能介绍创建一个MRS集群。使用接口前，您需要先获取下的资源信息。通过VPC创建或查询VPC、子网通过ECS创建或查询密钥对通过终端节点获取区域信息参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息接口约束无调用方法请参见如何调用API。 URI

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口

总条数： 2333

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

HBase Phoenix API接口介绍 - MapReduce服务 MRS

使用Kafka流控工具限制生产消费速度 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

创建Hive角色 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

Flux开发指引 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

HDFS HTTP REST API接口介绍 - MapReduce服务 MRS

CDL数据集成概述 - MapReduce服务 MRS

SparkSQL用户权限介绍 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线