搜索_华为云

配置Kafka数据均衡工具 - MapReduce服务 MRS

配置Kafka数据均衡工具操作场景该任务指导管理员根据业务需求，在客户端中执行Kafka均衡工具来均衡Kafka集群的负载，一般用于节点的退服、入服以及负载均衡的场景。前提条件 MRS集群管理员已明确业务需求，并准备一个Kafka管理员用户（属于kafkaadmin组，普通模式不需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka企业级能力增强
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。如需使用Hudi，请确保MRS集群内已安装Spark/Spark2x服务

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

配置Hive表、列或数据库的用户权限操作场景使用Hive表或者数据库时，如果用户访问别人创建的表或数据库，需要授予对应的权限。为了实现更严格权限控制，Hive也支持列级别的权限控制。如果要访问别人创建的表上某些列，需要授予列权限。以下介绍使用Manager角色管理功能在表授权、

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive用户权限管理
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS 应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。 CDM支持文件到文件类数据的迁移，

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

使用Loader从Hive导出数据到关系型数据库操作场景该任务指导用户使用Loader将数据从Hive导出到关系型数据库。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的Hive表。获取关系型数据库使用的用户和密码。检查磁盘空间

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
在Hue WebUI使用元数据浏览器 - MapReduce服务 MRS

在Hue WebUI使用元数据浏览器操作场景用户需要使用图形化界面在集群中管理Hive的元数据，可以通过Hue完成任务。 Metastore管理器使用介绍访问Hue WebUI，请参考访问Hue WebUI界面。选择“Data Browsers > Metastore Tables

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x之前版本）
ALM-12081 ommdba用户过期 - MapReduce服务 MRS

ALM-12081 ommdba用户过期告警解释系统每天零点开始，每8小时检测当前系统中ommdba用户是否过期，如果用户过期，则发送告警。当系统中ommdba用户过期的期限重置，当前状态为正常，告警恢复。告警属性告警ID 告警级别是否自动清除 12081 重要是告警参数

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Sqoop客户端使用实践 - MapReduce服务 MRS

Sqoop客户端使用实践 Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(MySQL、PostgreSQL...)间进行数据的传递，可以将一个关系型数据库（例如：MySQL、Oracle、PostgreSQL等）中的数据导进到Hadoop的HDFS中，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
为什么存储小文件过程中，缓存中的数据会丢失 - MapReduce服务 MRS

为什么存储小文件过程中，缓存中的数据会丢失问题在存储小文件过程中，系统断电，缓存中的数据丢失。回答由于断电，当写操作完成之后，缓存中的block不会立即被写入磁盘，如果要同步地将缓存的block写入磁盘，用户需要将“客户端安装路径/HDFS/hadoop/etc/hadoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS常见问题
为什么存储小文件过程中，缓存中的数据会丢失 - MapReduce服务 MRS

为什么存储小文件过程中，缓存中的数据会丢失问题在存储小文件过程中，系统断电，缓存中的数据丢失。回答由于断电，当写操作完成之后，缓存中的block不会立即被写入磁盘，如果要同步地将缓存的block写入磁盘，用户需要将“客户端安装路径/HDFS/hadoop/etc/hadoop

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS常见问题
通过Flink作业处理OBS数据 - MapReduce服务 MRS

通过Flink作业处理OBS数据应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅做数据计算处理的存算分离模式。本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。方案架构 Flink是一个批处理和流处理结合的统一计算框架

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
创建Hive表 - MapReduce服务 MRS
创建Hive表 - MapReduce服务 MRS

创建Hive表功能介绍本小节介绍了如何使用HQL创建内部表、外部表的基本操作。创建表主要有以下三种方式：自定义表结构，以关键字EXTERNAL区分创建内部表和外部表。内部表，如果对数据的处理都由Hive完成，则应该使用内部表。在删除内部表时，元数据和数据一起被删除。外部表

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

应用场景大数据在人们的生活中无处不在，在IoT、电子商务、金融、制造、医疗、能源和政府部门等行业均可以使用华为云MRS服务进行大数据处理。海量数据分析场景海量数据分析是现代大数据系统中的主要场景。通常企业会包含多种数据源，接入后需要对数据进行ETL（Extract-Transform-Load

帮助中心 > MapReduce服务 MRS > 产品介绍
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 Sqoop是专为Apache Hadoop和结构化数据库（如关系型数据库）设计的高效传输大量数据的工具。客户需要在MRS中使用sqoop进行数据迁移，MRS旧版本中未自带Sqoop，客户可参考此文档自行安装使用。MRS 3.1.0及之后版本已支持创建集群时勾选

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
MapReduce Shuffle调优 - MapReduce服务 MRS

MapReduce Shuffle调优操作场景 Shuffle阶段是MapReduce性能的关键部分，包括了从Map task将中间数据写到磁盘一直到Reduce task复制数据并最终放到reduce函数的全部过程。这部分Hadoop提供了大量的调优参数。图1 Shuffle

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
使用Hive - MapReduce服务 MRS
使用Hive - MapReduce服务 MRS

使用Hive Hive用户权限管理 Hive客户端使用实践快速使用Hive进行数据分析 Hive数据存储及加密配置 Hive on HBase 配置Hive读取关系型数据库数据 Hive企业级能力增强 Hive性能调优 Hive运维管理 Hive常见SQL语法说明 Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版）

总条数： 4178

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Kafka数据均衡工具 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

在Hue WebUI使用元数据浏览器 - MapReduce服务 MRS

ALM-12081 ommdba用户过期 - MapReduce服务 MRS

Sqoop客户端使用实践 - MapReduce服务 MRS

为什么存储小文件过程中，缓存中的数据会丢失 - MapReduce服务 MRS

为什么存储小文件过程中，缓存中的数据会丢失 - MapReduce服务 MRS

通过Flink作业处理OBS数据 - MapReduce服务 MRS

创建Hive表 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

使用Hive - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线