搜索_华为云

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

tive Execution后，Spark SQL将自动为每个shuffle过程动态设置partition个数，而不是使用通用配置，使每次shuffle过程自动使用最合理的partition数。动态调整执行计划。在启用Adaptive Execution特性前，Spark S

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Yarn节点配置调优 - MapReduce服务 MRS

/srv/BigData/yarn/data2/nm/containerlogs。这样数据就会存储在所有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

group)有多个consumer先后启动，就是一个消费者组内有多个consumer同时消费多个partition数据，consumer端也会有负载均衡（consumer个数小于partitions数量时）。 consumer实际上是靠存储在zk中的临时节点来表明针对哪个topic的哪个

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化场景说明对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive故障排除
Yarn节点配置调优 - MapReduce服务 MRS

/srv/BigData/yarn/data2/nm/containerlogs。这样数据就会存储在所有设置的目录中，一般会是在不同的设备中。为保证磁盘IO负载均衡，需要提供几个路径且每个路径都对应一个单独的磁盘。应用程序的本地化后的日志目录存在于相对路径/application_%{appid}中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化场景说明对于需要使用动态分区插入（使用历史分区更新）数据到目的表中，且和数据源表是同一张表时，由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议先使用一个临时表来处理数据，再执行insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
消减Spark Insert Overwrite自读自写风险 - MapReduce服务 MRS

消减Spark Insert Overwrite自读自写风险场景说明对于目的表，需要使用动态分区插入（使用历史分区更新），且目的表和数据源表都是同一张表。由于直接在原表上执行insert overwrite可能会导致数据丢失或数据不一致的风险，建议首先使用一个临时表来处理数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

Agent1，2，3）负责处理日志，汇聚节点（Agent4）负责写入HDFS，每个收集节点的Agent可以选择多个汇聚节点，这样可以实现负载均衡。图3 Flume级联结构图 Flume的架构和详细原理介绍，请参见：https://flume.apache.org/releases/1

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

a,b; 命令执行后查看各个分组的数据条数是否相差不大，如果相差超过2/3或1/2，则需要重新选择分桶字段。 2千万以内数据禁止使用动态分区。动态分区会自动创建分区，而小表用户关注不到，会创建出大量不使用的分区分桶。创建表时，排序键key不能太多，一般建议3~5个；太多key会导致数据写入较慢，影响数据导入性能。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

关闭Executor个数动态分配功能的场景即“spark.dynamicAllocation.enabled”参数设为“false”时。 numExecutors * 2, with minimum of 3 Executor失败次数。开启Executor个数动态分配功能的场景即“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

关闭Executor个数动态分配功能的场景即“spark.dynamicAllocation.enabled”参数设为“false”时。 numExecutors * 2, with minimum of 3 Executor失败次数。开启Executor个数动态分配功能的场景即“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
MRS多租户简介 - MapReduce服务 MRS

资源池用来指定动态资源的配置。Yarn任务队列和资源池关联，可实现资源的分配和调度。一个租户只能设置一个默认资源池。用户通过绑定租户相关的角色，来使用该租户资源池的资源。若需要使用多个资源池的资源，可通过绑定多个租户相关的角色实现。动态资源调度机制： Yarn动态资源支持标签调度（Label

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户
建立Hive表分区提升查询效率 - MapReduce服务 MRS

PARTITON语句将数据加载到分区时，只能加载到静态分区。动态分区：通过查询命令，将结果插入到某个表的分区时，可以使用动态分区。动态分区通过在客户端工具执行如下命令开启： set hive.exec.dynamic.partition=true; 动态分区默认模式是“strict”，也就是必须

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
配置HetuEngine资源组 - MapReduce服务 MRS

al.pipeline组下动态创建的单用户管道组中。第四个选择器匹配来自BI工具的查询，BI工具有一个源与正则表达式jdbc#(?.*)匹配，并且客户端提供的标签是hi-pri的超集。这些查询被放置在global.adhoc组下动态创建的子组中。动态子组将基于命名变量tooln

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
配置Hive自读自写SQL防御规则 - MapReduce服务 MRS

operations are not allowed. (state=42000,code=40000) 设置Hive动态分区表精准拦截针对涉及动态分区的自读自写场景，由于动态分区在编译阶段获取不到输出的分区信息，无法判断是否存在自读自写场景，为了实现拦截功能，提供了nonstrict

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
compaction&cleaning配置 - MapReduce服务 MRS

Hudi是否应该基于最后24个提交的元数据动态计算insertSplitSize，默认关闭。 true hoodie.copyonwrite.record.size.estimate 平均记录大小。如果指定，Hudi将使用它，并且不会基于最后24个提交的元数据动态地计算。没有默认值设置。这对

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
配置MemArtsCC常用参数 - MapReduce服务 MRS

B的磁盘，MemArtsCC最大可使用的缓存空间为900GB，缓存超过900GB，MemArtsCC动态淘汰缓存。 0.3 cache_reserved_space 每块盘需要动态预留的空间。 cache_reserved_space决定磁盘预留空间，默认值为512MB，建议设置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
添加Hudi数据源 - MapReduce服务 MRS

Hudi连接器支持元数据缓存，以便更快地提供对各种操作的元数据请求。可参考调整HetuEngine元数据缓存。动态过滤开启动态过滤有助于Hudi连接器的Join算子的计算优化。可参考调整HetuEngine动态过滤。带分区条件查询建立分区表并且查询带分区过滤条件有助于过滤部分分区数据，从而提高性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Manager关键特性 - MapReduce服务 MRS

规划为一个集合体，这个集合体就是租户。多个不同的租户统称多租户。多租户功能支持层级式的租户模型，支持动态的添加和删除租户，实现资源的隔离，可以对租户的计算资源和存储资源进行动态配置和管理。计算资源指租户Yarn任务队列资源，可以修改任务队列的配额，并查看任务队列的使用状态和使用统计。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Manager
均衡Kafka扩容节点后数据 - MapReduce服务 MRS

均衡Kafka扩容节点后数据操作场景用户可以在Kafka扩容节点后，在客户端中执行Kafka均衡工具来均衡Kafka集群的负载。本章节内容适用于MRS 3.x之前版本。3.x及之后版本请参考配置Kafka数据均衡工具。前提条件 MRS集群管理员已明确业务需求，并准备一个K

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理

总条数： 331

上一页
1
...
5
6
7
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Consumer初始化成功但是无法从Kafka中获取指定Topic消息 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

消减Spark Insert Overwrite自读自写风险 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

MRS多租户简介 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

配置HetuEngine资源组 - MapReduce服务 MRS

配置Hive自读自写SQL防御规则 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

配置MemArtsCC常用参数 - MapReduce服务 MRS

添加Hudi数据源 - MapReduce服务 MRS

Manager关键特性 - MapReduce服务 MRS

均衡Kafka扩容节点后数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线