搜索_华为云

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。 CDM支持文件到文件类数据的迁移，本章节以MRS

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

ALM-12033 慢盘故障（2.x及以前版本）告警解释 MRS 2.x及以前版本：对于HDD盘，满足以下任意条件时触发告警：系统每3秒执行一次iostat命令，在30秒内连续10周期svctm值超过1000ms。系统每3秒执行一次iostat命令，在300秒内有超过60%的IO超过150ms。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
获取MRS应用开发样例工程 - MapReduce服务 MRS

获取MRS应用开发样例工程 MRS样例工程构建流程 MRS样例工程构建流程包括三个主要步骤：下载样例工程的Maven工程源码和配置文件，请参见样例工程获取地址。配置华为镜像站中SDK的Maven镜像仓库，请参见配置华为开源镜像仓。根据用户自身需求，构建完整的Maven工程并进行编译开发。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x）
配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS MRS支持用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算模式。MRS通过IAM服务的“委托”机制进行简单配置，实现使用ECS自动获取的临时AK/SK访问OBS。避免了AK/SK直接暴露在配置文件中的风险。通过绑定委托

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

配置ClickHouse对接普通模式Kafka 本章节适用于MRS 3.3.0-LTS及之后版本。操作场景本章节主要介绍ClickHouse连接普通模式的Kafka，消费Kafka的数据。前提条件已创建Kafka集群，且为普通模式（关闭Kerberos认证）。已创建Cl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
恢复Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

恢复Manager数据（MRS 3.x及之后版本）操作场景在用户意外修改、删除或需要找回数据时，系统管理员对FusionInsight Manager系统进行重大数据调整等操作后，系统数据出现异常或未达到预期结果，模块全部故障无法使用，需要对Manager进行恢复数据操作。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
Spark On Hudi性能调优 - MapReduce服务 MRS

Spark On Hudi性能调优优化Spark Shuffle参数提升Hudi写入效率开启spark.shuffle.readHostLocalDisk=true，本地磁盘读取shuffle数据，减少网络传输的开销。开启spark.io.encryption.enable

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
什么是MapReduce服务 - MapReduce服务 MRS

什么是MapReduce服务大数据是人类进入互联网时代以来面临的一个巨大问题：社会生产生活产生的数据量越来越大，数据种类越来越多，数据产生的速度越来越快。传统的数据处理技术，比如说单机存储，关系数据库已经无法解决这些新的大数据问题。为解决以上大数据处理问题，Apache基金会推

 帮助中心 > MapReduce服务 MRS > 产品介绍
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark2x提交spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
调测HBase Python样例程序 - MapReduce服务 MRS

调测HBase Python样例程序仅MRS 1.9.x及之前版本支持HBase python样例代码调测。 HBase支持使用自带的ThriftServer2服务通过python来访问HBase服务。python样例仅支持在Linux环境中运行，调测HBase python样

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 调测HBase应用
配置MRS集群告警阈值 - MapReduce服务 MRS

配置MRS集群告警阈值集群Manager支持配置监控指标阈值用于关注各指标的健康情况，如果出现异常的数据并满足预设条件后，系统将会触发一条告警信息，并在告警页面中出现此告警信息。配置MRS集群告警阈值（MRS 3.x及之后版本）登录FusionInsight Manager。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark，提交Spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
安装客户端（3.x及之后版本） - MapReduce服务 MRS

安装客户端（3.x及之后版本）操作场景该操作指导用户在MRS集群创建成功后安装MRS集群所有服务（不包含Flume）的客户端。Flume客户端安装请参见安装Flume客户端。客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。修改集群内组件的服务端配置后，建议重新

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
恢复ClickHouse业务数据 - MapReduce服务 MRS

恢复ClickHouse业务数据操作场景在用户意外修改、删除或需要找回数据时，集群用户对ClickHouse进行重大操作（如升级、重大数据调整等）后，系统数据出现异常或未达到预期结果，模块全部故障无法使用，或者迁移数据到新集群的场景中，需要对ClickHouse进行恢复数据操作。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
恢复Hive业务数据 - MapReduce服务 MRS

恢复Hive业务数据操作场景在用户意外修改、删除或需要找回数据时，系统管理员对Hive进行重大操作（如升级、重大数据调整等）后，系统数据出现异常或未达到预期结果，模块全部故障无法使用，或者迁移数据到新集群的场景中，需要对Hive进行恢复数据操作。系统管理员可以通过FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive 应用场景 MapReduce服务（MapReduce Service，简称MRS）提供企业级大数据集群云服务，里面包含HDFS、Hive、Spark等组件，适用于企业海量数据分析。其中Hive提供类SQL查询语言，帮助用户对大

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况应用场景 MRS离线处理集群，可对海量数据进行分析和处理，形成结果数据，供下一步数据应用使用。离线处理对处理时间要求不高，但是所处理数据量较大，占用计算存储资源较多，通常通过Hive/SparkSQL引擎或者MapReduce/Spark2x实现。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
配置Hive元数据存储至RDS - MapReduce服务 MRS

配置Hive元数据存储至RDS 本章节指导用户将现有集群的Hive元数据切换为RDS数据库中存储的元数据。该操作可以使多个MRS集群共用同一份元数据，且元数据不随集群的删除而删除，也能够避免集群迁移时Hive元数据的迁移。创建并配置RDS实例登录RDS管理控制台，购买RDS实例，具体操作请参考购买实例。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据

总条数： 418

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

恢复Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

什么是MapReduce服务 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

调测HBase Python样例程序 - MapReduce服务 MRS

配置MRS集群告警阈值 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

安装客户端（3.x及之后版本） - MapReduce服务 MRS

恢复ClickHouse业务数据 - MapReduce服务 MRS

恢复Hive业务数据 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

配置Hive元数据存储至RDS - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线