搜索_华为云

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务配置场景本章节操作适用于MRS 3.x及之后版本。分布式缓存在两种情况下非常有用。滚动升级在升级过程中，应用程序必须保持文字内容（jar文件或配置文件）不变。而这些内容并非基于当前版本的Yarn，而是要基于其提交时的版本。一般

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
Spark2x基本原理 - MapReduce服务 MRS

Streaming失败，这些接收到的数据也不会丢失。另外，接收数据的正确性只在数据被预写到日志以后Receiver才会确认，已经缓存但还没有保存的数据可以在Driver重新启动之后由数据源再发送一次。这两个机制确保了零数据丢失，即所有的数据或者从日志中恢复，或者由数据源重发。如果需要启用预写日志功能，可以通过如下动作实现：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
配置Hive分区元数据冷热存储 - MapReduce服务 MRS

配置Hive分区元数据冷热存储分区元数据冷热存储介绍为了减轻集群元数据库压力，将长时间未使用过的指定范围的分区相关元数据移动到备份表，这一过程称为分区数据冻结，冻结的分区数据称为冷分区，未冻结的分区称为热分区，存在冷分区的表称为冻结表。将被冻结的数据重新移回原元数据表中，这一过程称为分区数据解冻。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
HBase开源增强特性 - MapReduce服务 MRS

HBase是一个Key-Value类型的分布式存储数据库。每张表的数据按照RowKey的字典顺序排序，因此，如果按照某个指定的RowKey去查询数据，或者指定某一个RowKey范围去扫描数据时，HBase可以快速定位到需要读取的数据位置，从而可以高效地获取到所需要的数据。在实际应用中，很多场景

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
MapReduce与其他组件的关系 - MapReduce服务 MRS

HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在MapReduce程序中计算的数据可以来自多个数据源，如Local

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
HDFS文件系统目录简介 - MapReduce服务 MRS

3.1.1.tar.gz 固定文件 MR分布式缓存功能使用的各jar包否 MR分布式缓存功能无法使用 /user/hive 固定目录 Hive相关数据存储的默认路径，包含依赖的spark lib包和用户默认表数据存储位置等否用户数据丢失 /user/omm-bulkload

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置Hive元数据存储至RDS - MapReduce服务 MRS

配置Hive元数据存储至RDS 本章节指导用户将现有集群的Hive元数据切换为RDS数据库中存储的元数据。该操作可以使多个MRS集群共用同一份元数据，且元数据不随集群的删除而删除，也能够避免集群迁移时Hive元数据的迁移。创建并配置RDS实例登录RDS管理控制台，购买RDS实例，具体操作请参考购买实例。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Kafka数据消费概述 - MapReduce服务 MRS

Kafka数据消费概述 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

NameNode中的数据保持同步，处理来自客户端的读请求。 DataNode 用于存储每个文件的“数据块”数据，并且会周期性地向NameNode报告该DataNode的数据存放情况。 JournalNode HA集群下，用于同步主备NameNode之间的元数据信息。 ZKFC Z

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

hiveobs 数据冗余存储策略多AZ存储：数据冗余存储至多个可用区（AZ），可靠性更高。单AZ存储：数据仅存储在单个可用区（AZ），成本更低。单AZ存储策略并行文件系统的读写策略。私有归档数据直读通过归档数据直读，您可以直接下载存储类别为归档存储的文件，而无需提前恢复。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
添加HBase数据源 - MapReduce服务 MRS

表示该表为HBase数据源中表的一个映射表，不支持删除HBase数据源上的原始表；如果external=false，则删除Hetu-HBase表的同时，会删除HBase数据源上的表。 HBase数据类型映射 HBase是基于字节的分布式存储系统，它将所有数据类型存储为字节数组。要在H

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
HBase本地二级索引介绍 - MapReduce服务 MRS

HBase是基于Key-Value的分布式存储数据库，基于rowkeys对表中的数据按照字典进行排序。如果您根据指定的rowkey查询数据，或者扫描指定rowkey范围内的数据，HBase可以快速查找到需要读取的数据，从而提高效率。在大多数实际情况下，会需要查询列值为XXX的数据。HBase提供了

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

基于分区键（partitioning key）的数据分区分块存储数据索引排序（基于primary key和order by）支持数据复制（带Replicated前缀的表引擎）支持数据抽样在写入数据时，该系列引擎表会按照分区键将数据分成不同的文件夹，文件夹内每列数据为不同的独立文件，以及创建数据的序列化索引排

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
Presto - MapReduce服务 MRS
Presto - MapReduce服务 MRS

大小的数据源进行交互式分析查询。其主要应用于海量结构化数据/半结构化数据分析、海量多维数据聚合/报表、ETL、Ad-Hoc查询等场景。 Presto允许查询的数据源包括Hadoop分布式文件系统（HDFS），Hive，HBase，Cassandra，关系数据库甚至专有数据存储。一

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
配置Ranger元数据存储至RDS - MapReduce服务 MRS

配置Ranger元数据存储至RDS 本章节旨在指导用户将现有集群的Ranger元数据切换为RDS数据库中存储的元数据。该操作可以使多个MRS集群共用同一份元数据，且元数据不随集群的删除而删除，也能够避免集群迁移时Ranger元数据的迁移。停用集群组件Ranger鉴权该操作仅在MRS

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
HBase基本原理 - MapReduce服务 MRS
HBase基本原理 - MapReduce服务 MRS

HBase基本原理数据存储使用HBase来承接，HBase是一个开源的、面向列（Column-Oriented）、适合存储海量非结构化数据或半结构化数据的、具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统。更多关于HBase的信息，请参见：https://hbase

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
ALM-45429 ClickHouse扩容节点上同步表元数据失败 - MapReduce服务 MRS

ALM-45429 ClickHouse扩容节点上同步表元数据失败本章节仅适用于MRS 3.1.2及之后版本。告警解释 ClickHouse扩容时创建分布式表对应的本地表失败时产生该告警。告警属性告警ID 告警级别是否自动清除 45429 重要否告警参数参数名称参数含义

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Storm应用开发简介 - MapReduce服务 MRS

Storm是一个分布式的、可靠的、容错的数据流处理系统。它会把工作任务委托给不同类型的组件，每个组件负责处理一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发概述

总条数： 3533

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

配置使用分布式缓存执行MapReduce任务 - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

配置Hive分区元数据冷热存储 - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

配置Hive元数据存储至RDS - MapReduce服务 MRS

Kafka数据消费概述 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

添加HBase数据源 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

HBase本地二级索引介绍 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

Presto - MapReduce服务 MRS

配置Ranger元数据存储至RDS - MapReduce服务 MRS

HBase基本原理 - MapReduce服务 MRS

ALM-45429 ClickHouse扩容节点上同步表元数据失败 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线