搜索_华为云

创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。列数据类型在列名称后使用“->”指定。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
Storm应用开发简介 - MapReduce服务 MRS

Storm是一个分布式的、可靠的、容错的数据流处理系统。它会把工作任务委托给不同类型的组件，每个组件负责处理一项简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发概述
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

应用场景 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。 F

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Kafka应用开发简介 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式）
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

离线大规模分布式数据存储和计算及进行海量数据分析与查询的能力。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。创建MRS集群：创建一个MRS 3.1.5版本的“Hadoop分析集群”。安装集群客户端：下载并安装MRS集群客户端。准备应用程序及数据：准备MR

帮助中心 > MapReduce服务 MRS > 快速入门
创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。列数据类型在列名称后使用“->”指定。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase数据操作
非HDFS数据残留导致数据分布不均衡 - MapReduce服务 MRS

非HDFS数据残留导致数据分布不均衡问题背景与现象数据出现不均衡，某磁盘过满而其他磁盘未写满。 HDFS DataNode数据存储目录配置为“/export/data1/dfs--/export/data12/dfs”，看到的现象是大量数据都是存储到了“/export/data1/dfs”，其他盘的数据比较均衡。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
Kafka应用开发简介 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式）
快速开发Kafka应用 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Spark应用开发简介 - MapReduce服务 MRS

Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStream中的每个RDD包含了一个区间的数据。如图4所示。图4 DStream与RDD关系

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStream中的每个RDD包含了一个区间的数据。如图4所示。图4 DStream与RDD关系

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
Spark应用开发常用概念 - MapReduce服务 MRS

DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD一个只读的、可分区的分布式数据集。 DStream中的每个RDD包含了一个区间的数据。如图4所示。图4 DStream与RDD关系应用到DSt

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
MRS集群元数据概述 - MapReduce服务 MRS

MRS集群元数据概述 MRS的数据连接用于管理集群中组件使用的外部源连接，如Hive的元数据可以通过数据连接关联使用外部的关系型数据库。本地元数据：元数据存储于集群内自带的本地GaussDB中，当集群删除时元数据同时被删除，如需保存元数据，需提前前往数据库手动保存元数据。外置数

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切片，并建立索引，大幅提升缓存数据的读取性能。通过Zo

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

方案架构 Hive数据迁移分两部分内容： Hive的元数据信息，存储在MySQL等数据库中。MRS Hive集群的元数据会默认存储到MRS DBService组件，也可以选择RDS（MySQL）作为外置元数据库。 Hive的业务数据，存储在HDFS文件系统或OBS对象存储中。图1 Hive数据迁移示意

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Kafka应用开发简介 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）
Kafka应用开发简介 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > Kafka应用开发概述
Kafka应用开发简介 - MapReduce服务 MRS

Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量消息持久化到磁盘分布式系统易扩展

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式）
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
Spark应用开发简介 - MapReduce服务 MRS

Streaming提供的抽象概念。 DStream表示一个连续的数据流，是从数据源获取或者通过输入流转换生成的数据流。从本质上说，一个DStream表示一系列连续的RDD。RDD是一个只读的、可分区的分布式数据集。 DStream中的每个RDD包含了一个区间的数据。如图4所示。图4 DStream与RDD关系

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）

总条数： 3533

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建HBase索引进行数据查询 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

创建HBase索引进行数据查询 - MapReduce服务 MRS

非HDFS数据残留导致数据分布不均衡 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

快速开发Kafka应用 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

MRS集群元数据概述 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线