搜索_华为云

HDFS文件系统目录简介 - MapReduce服务 MRS

HDFS文件系统目录简介 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
HetuEngine用户权限说明 - MapReduce服务 MRS

HetuEngine用户权限说明 HetuEngine在集群已启用Kerberos认证（安全模式）时提供了如下两种权限管控方式，默认使用Ranger权限模型；在集群未启用Kerberos认证（普通模式）时提供了Ranger权限模型，默认未开启Ranger权限模型： Ranger权

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine用户权限管理
SparkSQL用户权限介绍 - MapReduce服务 MRS

SparkSQL用户权限介绍 SparkSQL权限类似于Hive，SparkSQL也是建立在Hadoop上的数据仓库框架，提供类似SQL的结构化数据。 MRS提供用户、用户组和角色，集群中的各类权限需要先授予角色，然后将用户或者用户组与角色绑定。用户只有绑定角色或者加入绑定角色的用户组，才能获得权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
ClickHouse基本原理 - MapReduce服务 MRS

ClickHouse基本原理 ClickHouse简介 ClickHouse是一款开源的面向联机分析处理的列式数据库，其独立于Hadoop大数据体系，最核心的特点是压缩率和极速查询性能。同时，ClickHouse支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
SparkSQL权限介绍 - MapReduce服务 MRS

SparkSQL权限介绍 SparkSQL权限类似于Hive，SparkSQL也是建立在Hadoop上的数据仓库框架，提供类似SQL的结构化数据。 MRS提供用户、用户组和角色，集群中的各类权限需要先授予角色，然后将用户或者用户组与角色绑定。用户只有绑定角色或者加入绑定角色的用户组，才能获得权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark用户权限管理
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka 应用场景 Kafka Eagle是一款分布式、高可用的Kafka监控软件，提供丰富的Kafka监控指标，例如：Kafka集群的Broker数、Topic数、Consumer数、Topic LogSize Top10、Topic Capacity

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置FlinkServer作业中使用UDF - MapReduce服务 MRS

配置FlinkServer作业中使用UDF 本章节适用于MRS 3.1.2及之后的版本。用户可以自定义一些函数，用于扩展SQL以满足个性化的需求，这类函数称为UDF。用户可以在Flink WebUI界面中上传并管理UDF jar包，然后在运行作业时调用相关UDF函数。 Flink支持以下3类自定义函数，如表1。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明表1 补丁基本信息补丁号 MRS 3.1.0.0.16 发布时间 2024-11-25 解决的问题提交Spark SQL作业，中文冒号被转换成英文冒号。 Spark SQL外表动态分区执行insert overwrite报错。 Spark JDBC产生空指针报错。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.1.0.0.16补丁说明
ClickHouse本地表设计 - MapReduce服务 MRS

ClickHouse本地表设计规则单表（分布式表）的记录数不要超过万亿，对于万亿以上表的查询，性能较差，且集群维护难度变大。单表（本地表）不超过百亿。表的设计都要考虑到数据的生命周期管理，需要进行TTL表属性设置或定期老化清理表分区数据。单表的字段建议不要超过5000列。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
配置通过ELB访问ClickHouse - MapReduce服务 MRS

配置通过ELB访问ClickHouse 当前ClickHouse不管是多分片还是多副本都是以集群方式部署，如果对外直接提供服务，将暴露多个节点服务，没有统一的访问入口。ClickHouse官方虽然提供了BalancedClickhouseDataSource的驱动方案，可以支持多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse企业级能力增强
通过ELB访问ClickHouse - MapReduce服务 MRS

通过ELB访问ClickHouse 当前ClickHouse不管是多分片还是多副本都是以集群方式部署，如果对外直接提供服务，将暴露多个节点服务，没有统一的访问入口。ClickHouse官方虽然提供了BalancedClickhouseDataSource的驱动方案，可以支持多节点

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse企业级能力增强
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive介绍 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式）
Flink安全认证机制说明 - MapReduce服务 MRS

Flink安全认证机制说明 Flink认证和加密 Flink集群中，各部件支持认证。 Flink集群内部各部件和外部部件之间，支持和外部部件如YARN、HDFS、ZooKeeprer进行kerberors认证。 Flink集群内部各部件之间，如Flink client和JobMa

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink用户权限管理
Flink安全认证机制说明 - MapReduce服务 MRS

Flink安全认证机制说明 Flink认证和加密 Flink集群中，各部件支持认证。 Flink集群内部各部件和外部部件之间，支持和外部部件如YARN、HDFS、ZooKeeprer进行Kerberors认证。 Flink集群内部各部件之间，如Flink client和JobMa

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink用户权限管理
MRS集群告警处理参考 - MapReduce服务 MRS

MRS集群告警处理参考 ALM-12001 审计日志转储失败 ALM-12004 OLdap资源异常 ALM-12005 OKerberos资源异常 ALM-12006 节点故障 ALM-12007 进程故障 ALM-12010 Manager主备节点间心跳中断 ALM-12011

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业

总条数： 2399

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS文件系统目录简介 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

HetuEngine用户权限说明 - MapReduce服务 MRS

SparkSQL用户权限介绍 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

ClickHouse基本原理 - MapReduce服务 MRS

SparkSQL权限介绍 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

配置FlinkServer作业中使用UDF - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

配置通过ELB访问ClickHouse - MapReduce服务 MRS

通过ELB访问ClickHouse - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

Flink安全认证机制说明 - MapReduce服务 MRS

Flink安全认证机制说明 - MapReduce服务 MRS

MRS集群告警处理参考 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线