搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。 RDD的存储：用户可以选择不同的存储级别缓存

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
快速开发HDFS应用 - MapReduce服务 MRS

HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ClickHouse数据分布设计 - MapReduce服务 MRS

use，来实现数据均匀。 Shard内数据副本高可靠存储数据写入单shard中的一个副本后，ClickHouse会自动异步将数据同步到其他副本，如图1中的shard-3。如果将10GB数据导入ClickHouse Node 5节点副本，ClickHouse会自动异步将数据同步到ClickHouse

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
ALM-45436 ClickHouse表数据倾斜 - MapReduce服务 MRS

ALM-45436 ClickHouse表数据倾斜告警解释 ClickHouse各节点之间，分布式表对应的本地表中，若存在数据倾斜，系统产生此告警。当检测到数据均衡时，告警自动清除。数据倾斜检测方法：当参数“min_table_check_data_bytes”值为“0”时，不启用数据倾斜检查。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark应用开发简介 - MapReduce服务 MRS

可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。 RDD的存储：用户可以选择不同的存储级别缓存

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建，或从与Hadoop兼容的其他存储系统中输入创建。从父RDD转换得到新RDD。从数据集合转换而来，通过编码实现。 RDD的存储：用户可以选择不同的存储级别缓存

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Impala服务是否支持磁盘热插拔 - MapReduce服务 MRS

回答 Impala服务的数据一般是存储在HDFS或者OBS（对象存储服务）中，无需直接使用本地节点的磁盘。仅Impalad实例在业务查询执行过程中由于内存空间不足，才需要溢写到磁盘（由--scratch_dirs指定）。由于是非多副本存储的临时数据，不提供磁盘热插拔能力。父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Impala > Impala常见问题
Impala服务是否支持磁盘热插拔 - MapReduce服务 MRS

回答 Impala服务的数据一般是存储在HDFS或者OBS（对象存储服务）中，无需直接使用本地节点的磁盘。仅Impalad实例在业务查询执行过程中由于内存空间不足，才需要溢写到磁盘（由--scratch_dirs指定）。由于是非多副本存储的临时数据，不提供磁盘热插拔能力。父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Impala > Impala常见问题
Presto应用开发简介 - MapReduce服务 MRS

Presto应用开发简介 Presto简介 Presto是一种开源、分布式SQL查询引擎，用于对千兆字节至PB级大小的数据源进行交互式分析查询。 Presto主要特点如下：多数据源：Presto可以支持Mysql，Hive，JMX等多种Connector。支持SQL：Presto完全支持ANSI

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发概述
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn Cluster模式运行框架如图1所示。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ooKeeper存储路径','副本名称', ...) Replicated表引擎需指定两个参数： ZooKeeper存储路径：ZooKeeper中该表相关数据的存储路径，建议规范化，如：/clickhouse/tables/{shard}/数据库名/表名。副本名称，一般用{replica}即可。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

以通过标签表达式指定副本位置，指定文件数据块的其中一个副本存放到高可靠性的节点上。 “/data”目录下的数据块，默认三副本情况下，其中至少有一个副本会被存放到RACK1或RACK2机架的节点上（RACK1和RACK2机架的节点为高可靠性节点），另外两个副本会被分别存放到RACK3和RACK4机架的节点上。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

以通过标签表达式指定副本位置，指定文件数据块的其中一个副本存放到高可靠性的节点上。 “/data”目录下的数据块，默认三副本情况下，其中至少有一个副本会被存放到RACK1或RACK2机架的节点上（RACK1和RACK2机架的节点为高可靠性节点），另外两个副本会被分别存放到RACK3和RACK4机架的节点上。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。列数据类型在列名称后使用“->”指定。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
HBase本地二级索引介绍 - MapReduce服务 MRS

HBase本地二级索引介绍场景介绍 HBase是基于Key-Value的分布式存储数据库，基于rowkeys对表中的数据按照字典进行排序。如果您根据指定的rowkey查询数据，或者扫描指定rowkey范围内的数据，HBase可以快速查找到需要读取的数据，从而提高效率。在大多数实

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 配置HBase本地二级索引提升查询效率
HBase开源增强特性 - MapReduce服务 MRS

HBase开源增强特性 HBase开源增强特性：HIndex HBase是一个Key-Value类型的分布式存储数据库。每张表的数据按照RowKey的字典顺序排序，因此，如果按照某个指定的RowKey去查询数据，或者指定某一个RowKey范围去扫描数据时，HBase可以快速定位到

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS 应用场景 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
ALM-45428 ClickHouse磁盘IO异常 - MapReduce服务 MRS

主机名产生告警的主机名对系统的影响 ClickHouse读写数据异常，本地表的INSERT、SELECT和CREATE操作概率异常，分布式表基本不受影响。影响业务，会导致IO失败。可能原因磁盘老化或者磁盘坏道。处理步骤在FusionInsight Manager首页，选择“运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 1009

上一页
1
...
5
6
7
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

ClickHouse数据分布设计 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

ALM-45436 ClickHouse表数据倾斜 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Impala服务是否支持磁盘热插拔 - MapReduce服务 MRS

Impala服务是否支持磁盘热插拔 - MapReduce服务 MRS

Presto应用开发简介 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

配置HDFS文件目录标签策略（NodeLabel） - MapReduce服务 MRS

创建HBase索引进行数据查询 - MapReduce服务 MRS

HBase本地二级索引介绍 - MapReduce服务 MRS

HBase开源增强特性 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

ALM-45428 ClickHouse磁盘IO异常 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线