搜索_华为云

创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase数据操作
使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

使用Loader从Hive导出数据到关系型数据库操作场景该任务指导用户使用Loader将数据从Hive导出到关系型数据库。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的Hive表。获取关系型数据库使用的用户和密码。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

在FusionInsight Manager界面，选择“集群 > 服务 > Guardian > 配置 > 全部配置”，搜索并修改以下参数后，单击“保存”。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

HBase集群使用Hadoop和HBase组件提供一个稳定可靠、性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。

帮助中心 > MapReduce服务 MRS > 快速入门
HBase应用开发简介 - MapReduce服务 MRS

HBase设计目标是解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。具有很好的伸缩能力。能够同时处理结构化和非结构化的数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发概述
HBase应用开发简介 - MapReduce服务 MRS

HBase设计目标是解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。具有很好的伸缩能力。能够同时处理结构化和非结构化的数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发概述
HBase应用开发简介 - MapReduce服务 MRS

HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。具有很好的伸缩能力。能够同时处理结构化和非结构化的数据。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式）
HBase应用开发简介 - MapReduce服务 MRS

HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。具有很好的伸缩能力。能够同时处理结构化和非结构化的数据。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式）
MapReduce Shuffle调优 - MapReduce服务 MRS

Copy阶段的调优数据是否压缩：对Map的中间结果进行压缩，当数据量大时，会显著减少网络传输的数据量，但是也因为多了压缩和解压，带来了更多的CPU消耗。因此需要做好权衡。当任务属于网络瓶颈类型时，压缩Map中间结果效果明显。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
创建HBase索引进行数据查询 - MapReduce服务 MRS

创建HBase索引进行数据查询操作场景 HBase是一个Key-Value类型的分布式存储数据库，HIndex为HBase提供了按照某些列的值进行索引的能力，缩小搜索范围并缩短时延。使用约束列族应以“;”分隔。列和数据类型应包含在“[]”中。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase数据操作
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

这些Receiver接收并保存流数据到Spark内存中以供处理。用户传送数据的生命周期如图2所示：图2 数据传输生命周期接收数据（蓝色箭头） Receiver将数据流分成一系列小块，存储到Executor内存中。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Loader数据导入导出概述 - MapReduce服务 MRS

Loader支持如下数据导入方式：从关系型数据库导入数据到HDFS/OBS 从关系型数据库导入数据到HBase 从关系型数据库导入数据到Phoenix表从关系型数据库导入数据到Hive表从SFTP服务器导入数据到HDFS/OBS 从SFTP服务器导入数据到HBase 从SFTP

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader
数据导入 - MapReduce服务 MRS
数据导入 - MapReduce服务 MRS

数据导入概述使用Loader导入数据典型场景：从SFTP服务器导入数据到HDFS/OBS 典型场景：从SFTP服务器导入数据到HBase 典型场景：从SFTP服务器导入数据到Hive 典型场景：从FTP服务器导入数据到HBase 典型场景：从关系型数据库导入数据到HDFS/OBS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
数据写入 - MapReduce服务 MRS
数据写入 - MapReduce服务 MRS

数据写入写入更新数据时报错 Parquet/Avro schema 写入更新数据时报错UnsupportedOperationException 写入更新数据时报错SchemaCompatabilityException Hudi在upsert时占用了临时文件夹中大量空间 Hudi

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题
配置Ranger元数据存储至RDS - MapReduce服务 MRS

配置Ranger元数据存储至RDS 本章节旨在指导用户将现有集群的Ranger元数据切换为RDS数据库中存储的元数据。该操作可以使多个MRS集群共用同一份元数据，且元数据不随集群的删除而删除，也能够避免集群迁移时Ranger元数据的迁移。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Set Digest函数 - MapReduce服务 MRS
Set Digest函数 - MapReduce服务 MRS

它通常用于数据挖掘，用于大规模检测近乎相同的网页。通过使用这些信息，搜索引擎有效地避免了在搜索结果中显示两个几乎相同的网页。以下示例展示了如何使用Set Digest函数来简单估计文本之间的相似性。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
数据导出 - MapReduce服务 MRS
数据导出 - MapReduce服务 MRS

数据导出概述使用Loader导出数据典型场景：从HDFS/OBS导出数据到SFTP服务器典型场景：从HBase导出数据到SFTP服务器典型场景：从Hive导出数据到SFTP服务器典型场景：从HDFS/OBS导出数据到关系型数据库典型场景：从HBase导出数据到关系型数据库

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从关系型数据库导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
MRS存算分离配置流程说明 - MapReduce服务 MRS

MRS存算分离配置流程说明 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离
Spark常用配置参数 - MapReduce服务 MRS

以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理

总条数： 3634

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建HBase索引进行数据查询 - MapReduce服务 MRS

使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

创建HBase索引进行数据查询 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Loader数据导入导出概述 - MapReduce服务 MRS

数据导入 - MapReduce服务 MRS

数据写入 - MapReduce服务 MRS

配置Ranger元数据存储至RDS - MapReduce服务 MRS

Set Digest函数 - MapReduce服务 MRS

数据导出 - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

MRS存算分离配置流程说明 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线