搜索_华为云

Hudi表索引设计规范 - MapReduce服务 MRS

已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
规划IoTDB容量 - MapReduce服务 MRS
规划IoTDB容量 - MapReduce服务 MRS

规划IoTDB容量 IoTDB自身有多副本机制，region（schema region和data region）默认是3副本。ConfigNode上保存region和IoTDBServer的映射关系，IoTDBServer保存region数据，直接使用操作系统自身的文件系统来管理元数据和数据文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB > IoTDB运维管理
Manager关键特性 - MapReduce服务 MRS

用户的管理及认证。整个系统使用LDAP管理用户，使用Kerberos进行认证，并在OMS和组件间各使用一套Kerberos和LDAP的管理机制，通过CAS实现单点登录（包括单点登录和单点登出）。用户只需要登录一次，即可在Manager WebUI和组件Web UI之间，甚至第三方

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

Hive表对接OBS文件系统应用场景 MRS支持用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离场景。用户通过IAM服务的“委托”机制进行简单配置，即可实现OBS的访问。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
Oozie应用开发简介 - MapReduce服务 MRS

job任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow 描述一个完整业务的基本流程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式）
Oozie应用开发简介 - MapReduce服务 MRS

job任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow 描述一个完整业务的基本流程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（安全模式）
HDFS应用开发常用概念 - MapReduce服务 MRS

地向NameNode报告该DataNode的数据存放情况。 NameNode 用于管理文件系统的命名空间、目录结构、元数据信息以及提供备份机制等。 Active NameNode：主NameNode，管理文件系统的命名空间、维护文件系统的目录结构树以及元数据信息；记录写入的每个“数据块”与其归属文件的对应关系。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发概述
Oozie应用开发应用开发简介 - MapReduce服务 MRS

工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow 描述一个完整业务的基本流程。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > Oozie应用开发概述
添加Storm的Ranger访问权限策略 - MapReduce服务 MRS

ole。页面已启用Ranger鉴权开关，该按钮控制是否启用Ranger插件进行权限管控，启用则使用Ranger鉴权，否则使用组件自身鉴权机制。图1 启用Ranger鉴权操作步骤使用Ranger管理员用户rangeradmin登录Ranger管理页面，具体操作可参考登录Ranger

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x） > Ranger权限策略配置示例
为什么已备份的Hive表无法执行drop操作 - MapReduce服务 MRS

快照，导致HDFS目录无法删除，造成Hive表删除失败。 Hive表在执行备份操作时，会创建表对应的HDFS数据目录快照。而HDFS的快照机制有一个约束：如果一个HDFS目录已创建快照，则在快照完全删除之前，该目录无法删除或修改名称。Hive表（除EXTERNAL表外）执行dro

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
Hudi支持Partial Update - MapReduce服务 MRS

下的最新数据逐一更新每行数据的不同列字段，直到整条数据完整。场景说明当前开源社区提供了PartialUpdateAvroPayload机制实现部分列更新，但该功能在多流更新，每条流更新不同列场景下会出现数据相互覆盖的问题。通过引入sequence组的概念，Hudi可以很好的解决该问题，实现真正的部分更新。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Colocation功能之前，建议用户对Colocation的内部机制有一定了解，包括： • Colocation分配节点原理 • 扩容与Colocation分配 • Colocation与数据节点容量 Colocation分配节点原理

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Colocation功能之前，建议用户对Colocation的内部机制有一定了解，包括： Colocation分配节点原理扩容与Colocation分配 Colocation与数据节点容量 Colocation分配节点原理

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
Oozie应用开发简介 - MapReduce服务 MRS

工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow 描述一个完整业务的基本流程。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > Oozie应用开发概述
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Colocation功能之前，建议用户对Colocation的内部机制有一定了解，包括： • Colocation分配节点原理 • 扩容与Colocation分配 • Colocation与数据节点容量 Colocation分配节点原理

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Colocation功能之前，建议用户对Colocation的内部机制有一定了解，包括： Colocation分配节点原理扩容与Colocation分配 Colocation与数据节点容量 Colocation分配节点原理

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
PMS进程占用内存高 - MapReduce服务 MRS

PostgreSQL缓存：除了常见的执行计划缓存、数据缓存，PostgreSQL为了提高生成执行计划的效率，还提供了catalog，relation等缓存机制。长连接场景下这些缓存中的某些缓存是不会主动释放的，因此可能导致长连接占用大量的内存不释放。 PMS是MRS的监控进程，此进程会经常创建表

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ClickHouse客户端使用实践 - MapReduce服务 MRS

edMergeTree引擎与ZooKeeper实现了复制表机制，用户在创建表时可以通过指定引擎选择该表是否高可用，每张表的分片与副本都是互相独立的。同时ClickHouse依靠Distributed引擎实现了分布式表机制，在所有分片（本地表）上建立视图进行分布式查询，使用很方便

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
Hudi支持聚合函数 - MapReduce服务 MRS

Hudi支持聚合函数本章节内容仅适用于MRS 3.5.0-LTS及之后版本。使用场景当前开源社区提供了可插拔的Payload机制，用于满足客户各种聚合需求。但Payload的开发有一定的门槛，因此MRS内置了一些常见的聚合函数满足客户日常需求。该特性允许用户使用Hudi自带的聚合函数实现相同主键的聚合操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。Hive的数据计算依赖于MapReduce、Spark、Tez。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive

总条数： 607

上一页
1
...
4
5
6
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - MapReduce服务 MRS

规划IoTDB容量 - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

HDFS应用开发常用概念 - MapReduce服务 MRS

Oozie应用开发应用开发简介 - MapReduce服务 MRS

添加Storm的Ranger访问权限策略 - MapReduce服务 MRS

为什么已备份的Hive表无法执行drop操作 - MapReduce服务 MRS

Hudi支持Partial Update - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

PMS进程占用内存高 - MapReduce服务 MRS

ClickHouse客户端使用实践 - MapReduce服务 MRS

Hudi支持聚合函数 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线