搜索_华为云

MRS集群用户鉴权策略 - MapReduce服务 MRS

er鉴权，用户可以通过组件的权限插件对组件资源的访问设置细粒度的安全访问策略。若不需使用Ranger进行鉴权，管理员可在服务页面手动停用Ranger鉴权，停用Ranger鉴权后，访问组件资源的时系统将继续基于FusionInsight Manager的角色模型进行权限控制。安全

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Bucket，需按照已有的数据量来进行分区分桶，能更好的提升导入及查询性能。Auto Bucket会造成Tablet数量过多，最终导致有大量的小文件。创建表时的副本数必须至少为2，默认是3，禁止使用单副本。没有聚合函数列的表不应该被创建为AGGREGATE表。创建主键表时需保持主键的列唯一，不建议将所有列

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
compaction&cleaning配置 - MapReduce服务 MRS

有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte hoodie.copyonwrite.insert.split.size 插入写入并行度。为单个分区的总共插入次数。写出100MB的文件，至少1KB大小的记录，意味着

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
访问MRS集群Manager - MapReduce服务 MRS

已创建好集群，并准备pem格式的密钥文件或创建集群时的密码。用户本地环境可以访问互联网。登录MRS管理控制台，选择“现有集群”。单击指定名称的MRS集群。记录集群的“安全组” 。为集群Master节点的安全组添加一条需要访问MRS集群的IP地址的入规则，允许指定来源的数据访问端口“22”。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群
重启MRS集群 - MapReduce服务 MRS
重启MRS集群 - MapReduce服务 MRS

费更长的时间，且对应服务的吞吐量、性能等可能会受到影响。建议在低业务负载时间段进行滚动重启操作。部分组件不支持滚动重启，在执行滚动重启集群的过程中，不支持滚动重启的组件仍将以普通重启方式进行重启，业务可能会中断。可参考组件重启参考信息。如果修改了端口类等需要尽快生效的配置（

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
Spark应用开发简介 - MapReduce服务 MRS

n下一个RDD的算子。如果直接翻译到物理实现，是很不经济的：一是每一个RDD（即使是中间结果）都需要物化到内存或存储中，费时费空间；二是join作为全局的barrier，是很昂贵的，会被最慢的那个节点拖死。如果子RDD的分区到父RDD的分区是窄依赖，就可以实施经典的fusion优

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
ClickHouse本地表设计 - MapReduce服务 MRS

MergeTree引擎在建表的时候支持列字段和表级的TTL。当列字段中的值过期时，ClickHouse会将其替换成数据类型的默认值。如果分区内，某一列的所有值均已过期，则ClickHouse会从文件系统中删除这个分区目录下的列文件。当表内的数据过期时，ClickHouse会删除所有对应的行。在列上配置TTL：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收集等大量数据的互联网服务的数据收集场景。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Spark应用开发简介 - MapReduce服务 MRS

n下一个RDD的算子。如果直接翻译到物理实现，是很不经济的：一是每一个RDD（即使是中间结果）都需要物化到内存或存储中，费时费空间；二是join作为全局的barrier，是很昂贵的，会被最慢的那个节点拖死。如果子RDD的分区到父RDD的分区是窄依赖，就可以实施经典的fusion优

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Dependency（RDD的依赖） RDD的依赖分别为：窄依赖和宽依赖。图1 RDD的依赖窄依赖：指父RDD的每一个分区最多被一个子RDD的分区所用。宽依赖：指子RDD的分区依赖于父RDD的所有分区。窄依赖对优化很有利。逻辑上，每个RDD的算子都是一个fork/join

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
入门实践 - MapReduce服务 MRS
入门实践 - MapReduce服务 MRS

当完成MRS集群部署后，可以根据自身的业务需求使用MRS提供的一系列常用实践。表1 MRS常用最佳实践实践描述数据分析使用Spark2x实现车联网车主驾驶行为分析本实践指导使用Spark实现车主驾驶行为分析。用于了解MRS的基本功能，利用MRS服务的Spark2x组件，对车主的驾驶行为进行分

 帮助中心 > MapReduce服务 MRS > 快速入门
Spark应用开发简介 - MapReduce服务 MRS

Dependency（RDD的依赖） RDD的依赖分别为：窄依赖和宽依赖。图1 RDD的依赖窄依赖：指父RDD的每一个分区最多被一个子RDD的分区所用。宽依赖：指子RDD的分区依赖于父RDD的所有分区。窄依赖对优化很有利。逻辑上，每个RDD的算子都是一个fork/join

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
CarbonData调优思路 - MapReduce服务 MRS

ata数据存储的HDFS block对扫描任务进行分割。扫描任务由集群中的执行器执行。扫描任务可以并行、部分并行，或顺序处理，具体采用的方式取决于执行器的数量以及配置的执行器核数。查询任务的某些部分可在独立的任务级上处理，例如select和filter。查询任务的某些部分可在独

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
CarbonData调优思路 - MapReduce服务 MRS

ata数据存储的HDFS block对扫描任务进行分割。扫描任务由集群中的执行器执行。扫描任务可以并行、部分并行，或顺序处理，具体采用的方式取决于执行器的数量以及配置的执行器核数。查询任务的某些部分可在独立的任务级上处理，例如select和filter。查询任务的某些部分可在独

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
购买专属云MRS集群 - MapReduce服务 MRS

务自研组件，提供长期的支持和演进。普通版：主要依托开源组件的能力，融入了MRS服务自研、成熟稳定的特性和功能，带来性能及稳定性的提升。 LTS版集群版本 MRS集群的版本，不同版本所包含的开源组件版本及功能特性可能不同，推荐选择最新版本。版本详细包含的组件详细可参考MRS组件版本一览表。

帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
重启MRS集群组件 - MapReduce服务 MRS

只重启配置过期的实例 - 是否只重启集群内修改过配置的实例。部分版本该参数名称为“仅重启配置过期的实例”，请以实际显示为准。启用机架策略 - 是否启用机架并发滚动重启策略，只对满足机架策略滚动重启的角色（角色支持机架感知功能，且角色下的实例归属于2个或2个以上的机架）生效。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
提交Spark任务到新增Task节点 - MapReduce服务 MRS

本章节指导用户通过租户资源绑定新增的Task节点，并提交Spark任务到新增的Task节点。方案架构租户是MRS大数据平台的核心概念，使传统的以用户为核心的大数据平台向以多租户为核心的大数据平台转变，更好的适应现代企业多租户应用环境，如图1所示。图1 以用户为核心的平台和以多租户为核心的平台对于

 帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

个队列，再选择队列上的一个应用，并尝试在这个应用上分配资源。若因参数限制导致分配失败，将选择下一个应用。选择一个应用后，调度器会处理此应用的资源申请。其优先级从高到低依次为：本地资源的申请、同机架的申请，任意机器的申请。图2 资源分配模型 YARN原理新的Hadoop Map

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
Flink应用性能调优建议 - MapReduce服务 MRS

度让任务的数量和每个任务处理的数据与机器的处理能力达到最优。查看CPU使用情况和内存占用情况，当任务和数据不是平均分布在各节点，而是集中在个别节点时，可以增大并行度使任务和数据更均匀的分布在各个节点。增加任务的并行度，充分利用集群机器的计算能力。任务的并行度可以通过以下四种层

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题

总条数： 110

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS集群用户鉴权策略 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

访问MRS集群Manager - MapReduce服务 MRS

重启MRS集群 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

入门实践 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

购买专属云MRS集群 - MapReduce服务 MRS

重启MRS集群组件 - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线