搜索_华为云

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

Elasticsearch-Hadoop (ES-Hadoop) 连接器将Hadoop海量的数据存储和深度加工能力与Elasticsearch实时搜索和分析功能结合在一起。它能够让您快速深入了解大数据，并让您在Hadoop生态系统中更好地开展工作。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

指导。wordcount是最经典的Hadoop作业，用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生态，采用Yarn管理集群资源，提供Hive、Spark离线大规模分布式数据存储和计算及进行海量数据分析与查询的能力。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。

帮助中心 > MapReduce服务 MRS > 快速入门
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件配置场景文件压缩可以减少储存文件的空间，并且提高数据从磁盘读取和网络传输的速度。HDFS有Gzip和Snappy这两种默认压缩格式。本章节为HDFS新增加的压缩格式LZC（Lempel-Ziv Compression）提供配置方法。这种压缩格

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
Hive应用开发建议 - MapReduce服务 MRS

为了避免在插入动态分区数据的过程中，产生过多的小文件，在执行插入时，在分区字段上加上distribute by。存储文件格式优化建议 Hive支持多种存储格式，比如TextFile，RCFile，ORC，Sequence，Parquet等。为了节省存储空间，或者大部分时间只查询其中的一部

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hive应用开发规范
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
HDFS文件系统目录简介 - MapReduce服务 MRS

添加租户时创建配置租户在HDFS中的存储目录，系统默认将自动在“/tenant”目录中以租户名称创建文件夹。例如租户“ta1”，默认HDFS存储目录为“tenant/ta1”。第一次创建租户时，系统自动在HDFS根目录创建“/tenant”目录。支持自定义存储路径。否租户不可用 /apps{1~5}/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

X，请执行搬迁前务必确认是否支持搬迁。方案架构 Hive数据迁移分两部分内容： Hive的元数据信息，存储在MySQL等数据库中。MRS Hive集群的元数据会默认存储到MRS DBService组件，也可以选择RDS（MySQL）作为外置元数据库。 Hive的业务数据，存储在HDFS文件系统或OBS对象存储中。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

指导。wordcount是最经典的Hadoop作业，用于统计海量文本的单词数量。 Hadoop集群完全使用开源Hadoop生态，采用Yarn管理集群资源，提供Hive、Spark离线大规模分布式数据存储和计算及进行海量数据分析与查询的能力。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。

帮助中心 > MapReduce服务 MRS > 快速入门
存储配置 - MapReduce服务 MRS
存储配置 - MapReduce服务 MRS

存储配置参数描述默认值 hoodie.parquet.max.file.size Hudi写阶段生成的parquet文件的目标大小。对于DFS，这需要与基础文件系统块大小保持一致，以实现最佳性能。 120 * 1024 * 1024 byte hoodie.parquet.block

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
Hive应用开发简介 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发概述
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件配置场景文件压缩可以减少储存文件的空间，并且提高数据从磁盘读取和网络传输的速度。HDFS有Gzip和Snappy这两种默认压缩格式。本章节为HDFS新增加的压缩格式LZC（Lempel-Ziv Compression）提供配置方法。这种压缩格

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
Hive应用开发简介 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发概述
使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

本章节以Tableau Desktop 2022.2版本为例，讲解如何使用Tableau访问安全模式集群的HetuEngine。方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Hive应用开发简介 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式）
Hive应用开发简介 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式）
批量写入Hudi表 - MapReduce服务 MRS

该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而UPSERT和INSERT操作使用启发式方法可以很好的控制小文件。 UPSERT（插入更新）：默认操作类型。Hudi会根据主键进行判断，如果历史数据存在则update

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

io位于计算和存储之间，为包括Apache Spark、Presto、Mapreduce和Apache Hive的计算框架提供了数据抽象层，使上层的计算应用可以通过统一的客户端API和全局命名空间访问包括HDFS和OBS在内的持久化存储系统，从而实现了对计算和存储的分离。图1 Alluxio架构

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
快速开发Hive JDBC应用 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Hive HCatalog应用 - MapReduce服务 MRS

uce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。通过HQL完成海量结构化数据分析。灵活的数据存储格式，支持JSON、CSV、TEXTFILE、RCFIL

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
HBase基本原理 - MapReduce服务 MRS
HBase基本原理 - MapReduce服务 MRS

RegionServer数据存储 RegionServer主要负责管理由HMaster分配的Region，RegionServer的数据存储结构如图 RegionServer的数据存储结构所示。图3 RegionServer的数据存储结构图 RegionServer的数据存储结构中Region的各部分的说明如表

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase

总条数： 3174

上一页
1
...
4
5
6
...
159
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Hive对接CSS服务配置说明 - MapReduce服务 MRS

快速创建和使用启用安全认证的MRS集群 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

Hive应用开发建议 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

存储配置 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

使用Tableau访问MRS HetuEngine - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 - MapReduce服务 MRS

HBase基本原理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线