搜索_华为云

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。 CDM支持文件到文件类数据的迁移，本章节以MRS

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

MRS Hive对接CSS服务配置说明应用场景利用Elasticsearch-Hadoop插件，完成Hive和CSS服务的Elasticsearch直接的数据交互，通过Hive外部表的方式，可以快速将Elasticsearch索引数据映射到Hive表中。 Elasticsearch-Hadoop

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation）功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation）功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

在本地Windows环境中调测HDFS程序操作场景在代码完成开发后，您可以在Windows开发环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。 HDFS应用程序运行完成后，可直接通过运行结果查看应用程序运行情况，也可以通过HDFS日志获取应用运行情况。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 调测HDFS应用
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

YARN基本原理为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性，并消除早期MapReduce框架中的JobTracker性能瓶颈，开源社区引入了统一的资源管理框架YARN。 YARN是将JobTracker的两个主要功能（资源管理和作业调度/监控）分离，主要方法是创建

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage失败重试次数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

在本地Windows环境中调测HDFS程序操作场景在代码完成开发后，您可以在Windows开发环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。 HDFS应用程序运行完成后，可直接通过运行结果查看应用程序运行情况，也可以通过HDFS日志获取应用运行情况。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 调测HDFS应用
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群操作场景本入门提供从零开始创建ClickHouse集群并通过集群客户端进行ClickHouse表的创建与查询操作指导。 ClickHouse是一款开源的面向联机分析处理的列式数据库，独立于Hadoop大数据体系，具有压缩率和极速查询性能。

帮助中心 > MapReduce服务 MRS > 快速入门
常用参数 - MapReduce服务 MRS
常用参数 - MapReduce服务 MRS

常用参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置参数。配置Stage失败重试次数 Sp

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
同步Kafka数据至ClickHouse - MapReduce服务 MRS

同步Kafka数据至ClickHouse 您可以通过创建Kafka引擎表将Kafka数据自动同步至ClickHouse集群，具体操作详见本章节描述。前提条件已创建Kafka集群。已安装Kafka客户端，详细可以参考安装客户端。已创建ClickHouse集群，并且ClickH

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入
补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明表1 补丁基本信息补丁号 MRS 3.2.0-LTS.1.10 发布时间 2024-10-30 解决的问题解决Flume后台卸载客户端后，从Flume管理的页面上无法删除该客户端实例的问题。解决Kafka时延监控转告警（Topic数量监控、分区数量监控、请求时延监控）的问题。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.10补丁说明
快速开发HBase应用 - MapReduce服务 MRS

快速开发HBase应用 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息应用场景 MRS Hadoop分析集群，提供Hive、Spark离线大规模分布式数据存储和计算，进行海量数据分析与查询。本实践基于华为云MapReduce服务，用于指导您创建MRS集群后，使用Hive对OBS中存储的原始数据进行导入

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

快速创建和使用启用安全认证的MRS集群操作场景本入门提供从零开始创建开启Kerberos认证的Hadoop分析集群并通过集群客户端提交一个wordcount作业的操作指导。wordcount是最经典的Hadoop作业，用于统计海量文本的单词数量。 Hadoop集群完全使用开源

 帮助中心 > MapReduce服务 MRS > 快速入门
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > HBase应用开发常见问题
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
配置FlinkServer作业重启策略 - MapReduce服务 MRS

配置FlinkServer作业重启策略 FlinkServer作业重启策略介绍 Flink支持不同的重启策略，以在发生故障时控制作业是否重启以及如何重启。如果不指定重启策略，集群会使用默认的重启策略。用户也可以在提交作业时指定一个重启策略，可参考如何创建FlinkServer作业在作业开发界面配置（MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业

总条数： 292

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

在本地Windows环境中调测HDFS程序 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

常用参数 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

快速开发HBase应用 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

配置FlinkServer作业重启策略 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线