搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
常见概念 - MapReduce服务 MRS
常见概念 - MapReduce服务 MRS

常见概念 HBase表 HBase的表是三个维度排序的映射。从行主键、列主键和时间戳映射为单元格的值。所有的数据存储在HBase的表单元格中。列 HBase表的一个维度。列名称的格式为“<family>:<label>”，<family>和<label>为任意字符组合。表由<f

帮助中心 > MapReduce服务 MRS > 产品介绍
配置HBase主备集群容灾 - MapReduce服务 MRS

配置HBase主备集群容灾操作场景 HBase集群容灾作为提高HBase集群系统高可用性的一个关键特性，为HBase提供了实时的异地数据容灾功能。它对外提供了基础的运维工具，包含灾备关系维护，重建，数据校验，数据同步进展查看等功能。为了实现数据的实时容灾，可以把本HBase集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > HBase应用开发常见问题
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中本章节为您介绍使用Maxwell同步工具将线下基于binlog的数据迁移到MRS Kafka集群中的指导。 Maxwell是一个开源程序（https://maxwells-daemon.io），通过读取MySQL的binlog日

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka常见问题
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中本章节为您介绍使用Maxwell同步工具将线下基于binlog的数据迁移到MRS Kafka集群中的指导。 Maxwell是一个开源程序（https://maxwells-daemon.io），通过读取MySQL的binlog日

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息应用场景 MRS Hadoop分析集群，提供Hive、Spark离线大规模分布式数据存储和计算，进行海量数据分析与查询。本实践基于华为云MapReduce服务，用于指导您创建MRS集群后，使用Hive对OBS中存储的原始数据进行导入

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
导出Doris数据至HDFS - MapReduce服务 MRS

导出Doris数据至HDFS 数据导出（Export）功能可以将用户指定的表或分区的数据，以文本的格式通过Broker进程导出到远端存储上，如HDFS/对象存储（支持S3协议）等。不建议一次性导出大量数据。一个Export作业建议的导出数据量最大在几十GB。过大的导出会导致更多的垃圾文件和更高的重试成本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distr

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
获取MRS应用开发样例工程 - MapReduce服务 MRS

获取MRS应用开发样例工程 MRS样例工程构建流程 MRS样例工程构建流程包括三个主要步骤：下载样例工程的Maven工程源码和配置文件，请参见获取MRS样例工程。配置华为镜像站中SDK的Maven镜像仓库，请参见配置华为开源镜像仓。根据用户自身需求，构建完整的Maven工程并进行编译开发。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

创建集群功能介绍创建一个MRS集群。使用接口前，您需要先获取下的资源信息。通过VPC创建或查询VPC、子网通过ECS创建或查询密钥对通过终端节点获取区域信息参考MRS服务支持的组件获取MRS版本及对应版本支持的组件信息接口约束无调用方法请参见如何调用API。 URI

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hudi表本章节适用于MRS 3.1.2及之后的版本。操作场景本指南通过使用FlinkServer写FlinkSQL对接Hudi。FlinkSQL读写Hudi时，不支持定义TINYINT、SMALLINT和TIME类型。 Flink对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
在本地Windows中调测HDFS程序 - MapReduce服务 MRS

在本地Windows中调测HDFS程序操作场景在代码完成开发后，您可以在Windows开发环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。 HDFS应用程序运行完成后，可直接通过运行结果查看应用程序运行情况，也可以通过HDFS日志获取应用运行情况。在本地Windows中调测HDFS程序

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 调测HDFS应用
Flume业务配置指南 - MapReduce服务 MRS

Flume业务配置指南本章节适用于MRS 3.x及之后版本。该操作指导用户完成Flume常用业务的配置。其他一些不太常用的Source、Channel、Sink的配置请参考Flume社区提供的用户手册（http://flume.apache.org/releases/1.9.0

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Spark2x基本原理 - MapReduce服务 MRS

Spark2x基本原理 Spark2x组件适用于MRS 3.x及后续版本。简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

Spark基本原理 Spark简介 Spark是一个开源的，并行数据处理框架，能够帮助用户简单、快速的开发大数据应用，对数据进行离线处理、流式处理、交互式分析等。 Spark提供了一个快速的计算、写入及交互式查询的框架。相比于Hadoop，Spark拥有明显的性能优势。Spark

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Flink Java API接口介绍 - MapReduce服务 MRS

Flink Java API接口介绍由于Flink开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Flink常用接口 Flink主要使用到如下这几个类： StreamExecutionEnvironment：是Flink流处理的基础，提供了程序的执行环境。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
Flink Java API接口介绍 - MapReduce服务 MRS

Flink Java API接口介绍由于Flink开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Flink常用接口 Flink主要使用到如下这几个类： StreamExecutionEnvironment：是Flink流处理的基础，提供了程序的执行环境。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍

总条数： 803

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

常见概念 - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

导出Doris数据至HDFS - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Hudi表 - MapReduce服务 MRS

在本地Windows中调测HDFS程序 - MapReduce服务 MRS

Flume业务配置指南 - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

Flink Java API接口介绍 - MapReduce服务 MRS

Flink Java API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线