搜索_华为云

概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

概述 “数据导入”章节适用于MRS 3.x及后续版本。简介 Loader是实现MRS与外部数据源如关系型数据库、SFTP服务器、FTP服务器之间交换数据和文件的ETL工具，支持将数据或文件从关系型数据库或文件系统导入到MRS服务中。 Loader支持如下数据导入方式：从关系型数据库导入数据到HDFS/OBS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

Flume基本原理 Flume是一个高可用、高可靠，分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接收方（可定制）的能力。其中Flume-NG是Flume的一个分支，其特点

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(D

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Spark2x与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
HDFS开源增强特性 - MapReduce服务 MRS

HDFS开源增强特性 HDFS开源增强特性：文件块同分布（Colocation）离线数据汇总统计场景中，Join是一个经常用到的计算功能，在MapReduce中的实现方式大体如下： Map任务分别将两个表文件的记录处理成（Join Key，Value），然后按照Join Key

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
Hudi表初始化 - MapReduce服务 MRS
Hudi表初始化 - MapReduce服务 MRS

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
Flink常用配置参数 - MapReduce服务 MRS

的运行在Yarn上，配置项包括yarn container的内存，虚拟内核，端口等。 Pipeline：为适应某些场景对降低时延的需求，设计多个Job间采用Netty直接相连的方式传递数据，即分别使用NettySink用于Server端、NettySource用于Client端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink运维管理
Flink Kafka样例程序开发思路 - MapReduce服务 MRS

Flink Kafka样例程序开发思路场景说明假定某个Flink业务每秒就会收到1个消息记录。基于某些业务要求，开发的Flink应用程序实现功能：实时输出带有前缀的消息内容。数据规划 Flink样例工程的数据存储在Kafka组件中。向Kafka组件发送数据（需要有Kafk

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
Loader数据导入导出概述 - MapReduce服务 MRS

Loader数据导入导出概述 Loader数据导入简介 Loader是实现MRS与外部数据源如关系型数据库、SFTP服务器、FTP服务器之间交换数据和文件的ETL工具，支持将数据或文件从关系型数据库或文件系统导入到MRS系统中。 Loader支持如下数据导入方式：从关系型数据库导入数据到HDFS/OBS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader
Flink Kafka样例程序开发思路 - MapReduce服务 MRS

Flink Kafka样例程序开发思路场景说明假定某个Flink业务每秒就会收到1个消息记录。基于某些业务要求，开发的Flink应用程序实现功能：实时输出带有前缀的消息内容。数据规划 Flink样例工程的数据存储在Kafka组件中。向Kafka组件发送数据（需要有Kafk

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统应用场景 MRS支持用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离场景。用户通过IAM服务的“委托”机制进行简单配置，即可实现OBS的访问。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
创建Strom Topology - MapReduce服务 MRS

创建Strom Topology 功能介绍一个Topology是Spouts和Bolts组成的有向无环图。应用程序是通过storm jar的方式提交，则需要在main函数中调用创建Topology的函数，并在storm jar参数中指定main函数所在类。代码样例下面代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > 开发Storm应用
通过Flink作业处理OBS数据 - MapReduce服务 MRS

通过Flink作业处理OBS数据应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅做数据计算处理的存算分离模式。本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。方案架构 Flink

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
创建Storm Topology - MapReduce服务 MRS

创建Storm Topology 功能介绍一个Topology是Spouts和Bolts组成的有向无环图。应用程序是通过storm jar的方式提交，则需要在main函数中调用创建Topology的函数，并在storm jar参数中指定main函数所在类。代码样例下面代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 开发Storm应用
创建Storm Topology - MapReduce服务 MRS

创建Storm Topology 功能介绍一个Topology是Spouts和Bolts组成的有向无环图。应用程序是通过storm jar的方式提交，则需要在main函数中调用创建Topology的函数，并在storm jar参数中指定main函数所在类。代码样例下面代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > 开发Storm应用
Spark2x基本原理 - MapReduce服务 MRS

Spark2x基本原理 Spark2x组件适用于MRS 3.x及后续版本。简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
创建IAM用户并授权使用MRS - MapReduce服务 MRS

创建IAM用户并授权使用MRS 如果您需要对您所拥有的MapReduce服务（MapReduce Service）进行精细的权限管理，您可以使用统一身份认证服务（Identity and Access Management，简称IAM），通过IAM，您可以：根据企业的业务组织，

帮助中心 > MapReduce服务 MRS > 用户指南 > 准备工作
快速开发HDFS应用 - MapReduce服务 MRS

快速开发HDFS应用 HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

使用Spark2x实现车联网车主驾驶行为分析应用场景本实践基于华为云MapReduce服务所编写，用于指导您了解MRS的基本功能，利用MRS服务的Spark2x组件，对车主的驾驶行为进行分析统计，得到用户驾驶行为的分析结果。原始数据为车主的驾驶行为信息，包括车主在日常的驾驶

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析

总条数： 395

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概述 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

Hudi表初始化 - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

Flink Kafka样例程序开发思路 - MapReduce服务 MRS

Loader数据导入导出概述 - MapReduce服务 MRS

Flink Kafka样例程序开发思路 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

创建Strom Topology - MapReduce服务 MRS

通过Flink作业处理OBS数据 - MapReduce服务 MRS

创建Storm Topology - MapReduce服务 MRS

创建Storm Topology - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

创建IAM用户并授权使用MRS - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

使用Spark2x实现车联网车主驾驶行为分析 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线