搜索_华为云

使用客户端运行Loader作业 - MapReduce服务 MRS

使用客户端运行Loader作业操作场景一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。 Loader不兼容旧版本客户端，如果重新安装集群或Loader服务，请

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路场景说明在Spark应用中，通过使用StructuredStreaming调用Kafka接口来获取单词记录，然后把单词记录分类统计，得到每个单词记录数。数据规划 StructuredStreaming样例工

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
备份Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

备份Manager数据（MRS 2.x及之前版本）操作场景为了确保元数据信息安全，或者用户在对元数据功能进行重大操作（如扩容缩容、安装补丁包、升级或迁移等）前后，需要对元数据进行备份，从而保证系统在出现异常或未达到预期结果时可以及时进行数据恢复，将对业务的影响降到最低。元数据

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 备份MRS集群组件数据
Spark Scala API接口介绍 - MapReduce服务 MRS

打印schema信息到控制台。 registerTempTable(tableName: String): Unit 将DataFrame注册为一张临时表，其周期和SQLContext绑定在一起。 toDF(colNames: String*): DataFrame 返回一个列重命名的DataFrame。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程该章节内容适用于MRS 3.3.0及之后版本。操作场景为了运行FusionInsight MRS产品Flink组件的SpringBoot接口样例代码，需要完成下面的操作。当前支持GaussDB（DWS）样例工程。该章节以在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 准备Flink应用开发环境
导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程该章节内容适用于MRS 3.3.0及之后版本。操作场景为了运行FusionInsight MRS产品Flink组件的SpringBoot接口样例代码，需要完成下面的操作。当前支持GaussDB（DWS）样例工程。该章节以在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 准备Flink应用开发环境
导出Doris数据至HDFS - MapReduce服务 MRS

导出Doris数据至HDFS 数据导出（Export）功能可以将用户指定的表或分区的数据，以文本的格式通过Broker进程导出到远端存储上，如HDFS/对象存储（支持S3协议）等。不建议一次性导出大量数据。一个Export作业建议的导出数据量最大在几十GB。过大的导出会导致更多的垃圾文件和更高的重试成本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hadoop集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Flink应用性能调优建议 - MapReduce服务 MRS

Flink应用性能调优建议配置内存 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
配置Flink应用安全认证 - MapReduce服务 MRS

配置Flink应用安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单地互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交Flink应用程序时，需要与Yarn、HDFS等之间进行通信。那么提交Flink的应用程序中需要设置安全认证，确保Flink程序能够正常运行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 准备Flink应用开发环境
准备Spark本地应用开发环境 - MapReduce服务 MRS

准备Spark本地应用开发环境 Spark2x可以使用Java/Scala/Python语言进行应用开发，要准备的开发和运行环境如表1所示。表1 开发环境准备项说明操作系统开发环境：Windows系统，支持Windows 7以上版本。运行环境：Windows系统或Linux系统。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
Spark Scala API接口介绍 - MapReduce服务 MRS

打印schema信息到控制台。 registerTempTable(tableName: String): Unit 将DataFrame注册为一张临时表，其周期和SQLContext绑定在一起。 toDF(colNames: String*): DataFrame 返回一个列重命名的DataFrame。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

打印schema信息到控制台。 registerTempTable(tableName: String): Unit 将DataFrame注册为一张临时表，其周期和SQLContext绑定在一起。 toDF(colNames: String*): DataFrame 返回一个列重命名的DataFrame。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

Flume基本原理 Flume是一个高可用、高可靠，分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接收方（可定制）的能力。其中Flume-NG是Flume的一个分支，其特点

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
快速使用IoTDB - MapReduce服务 MRS
快速使用IoTDB - MapReduce服务 MRS

快速使用IoTDB IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎。它具有体量轻、性能高、易使用的特点，支持对接Hadoop与Spark生态，适用于工业物联网应用中海量时间序列数据高速写入和复杂分析查询的需求。背景信息假定某某集团旗下有3个生产线，每个生产线

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
创建集群并执行作业 - MapReduce服务 MRS

创建集群并执行作业功能介绍创建一个MRS集群，并在集群中提交一个作业。该接口不兼容Sahara。（建议优先使用创建集群V2接口和创建集群并提交作业V2接口来完成创建集群或创建集群并提交作业的功能）支持同一时间并发创建10个集群。使用接口前，您需要先获取下的资源信息。通过VPC创建或查询VPC、子网

 帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
导入DWS表数据至ClickHouse - MapReduce服务 MRS

导入DWS表数据至ClickHouse ClickHouse支持CSV、JSON等格式文件的数据导入导出操作。本章节主要介绍怎么把DWS数据仓库服务中的表数据导出到CSV文件，再把CSV文件数据导入到ClickHouse表中。前提条件 ClickHouse集群和实例状态正常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
导入DWS表数据至ClickHouse - MapReduce服务 MRS

导入DWS表数据至ClickHouse ClickHouse支持CSV、JSON等格式文件的数据导入导出操作。本章节主要介绍怎么把DWS数据仓库服务中的表数据导出到CSV文件，再把CSV文件数据导入到ClickHouse表中。前提条件 ClickHouse集群和实例状态正常。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入

总条数： 1059

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用客户端运行Loader作业 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

Spark Structured Streaming样例程序开发思路 - MapReduce服务 MRS

备份Manager数据（MRS 2.x及之前版本） - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

导入并配置Flink SpringBoot样例工程 - MapReduce服务 MRS

导出Doris数据至HDFS - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

配置Flink应用安全认证 - MapReduce服务 MRS

准备Spark本地应用开发环境 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

快速使用IoTDB - MapReduce服务 MRS

创建集群并执行作业 - MapReduce服务 MRS

导入DWS表数据至ClickHouse - MapReduce服务 MRS

导入DWS表数据至ClickHouse - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线