搜索_华为云

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

行处理，每个task读取若干个shuffle输出文件，再对这部分任务的Join结果进行Union操作，以达到消除数据倾斜的效果配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

行处理，每个task读取部分shuffle输出文件，再对这部分任务的Join结果进行Union操作，以达到消除数据倾斜的效果。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Kafka日志介绍 - MapReduce服务 MRS
Kafka日志介绍 - MapReduce服务 MRS

Broker进程停止日志。 checkavailable.log Kafka服务健康状态检查日志。 checkInstanceHealth.log Broker实例健康状态检测日志。 kafka-authorizer.log Broker鉴权日志。 kafka-root.log Broker基础日志。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
配置MapReduce Job基线 - MapReduce服务 MRS

mapreduce.input.fileinputformat.split.maxsize map输入信息应被拆分成的数据块的最大大小。由用户定义的分片大小的设置及每个文件block大小的设置，可以计算分片的大小。计算公式如下： splitSize = Math.max(minSize

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

segments. <database_name>. <table_name> = < list of segment ids >” 如果用户想在多线程模式下查询指定段，可使用CarbonSession.threadSet代替SET语句。语法： “CarbonSession.threadSet

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
Storm应用开发常用概念 - MapReduce服务 MRS

t<tuple,Time>的方式来表示，tuple是元组，包含了数据结构和数据内容，Time就是该数据的逻辑时间。 keytab文件存放用户信息的密钥文件。应用程序采用此密钥文件在MRS产品中进行API方式认证。父主题： Storm应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发概述
数据目录SSD和HDD的配置导致建表时偶现报错 - MapReduce服务 MRS

_medium”默认为HDD，因此建表时会发现没有HDD介质的存储而报错。Doris并不会自动感知存储路径所在磁盘的实际存储介质类型，需要用户在路径配置中显式的表示。“.HDD”和“.SSD”只是用于标识存储目录“相对”的“低速”和“高速”之分，而并不是标识实际的存储介质类型，所

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

不能再使用相对路径来操作文件，而要使用绝对路径，并且保证所有的HiveServer节点和NodeManager节点上该文件是存在的且omm用户对该文件有相应的权限，才能正常在UDF中操作本地文件。父主题： Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

不能再使用相对路径来操作文件，而要使用绝对路径，并且保证所有的HiveServer节点和NodeManager节点上该文件是存在的且omm用户对该文件有相应的权限，才能正常在UDF中操作本地文件。父主题： Hive常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

参数解释：配置Manager管理员用户的密码。约束限制：不涉及取值范围：密码长度应在8-26个字符之间。至少包含四种字符组合，如大写字母，小写字母，数字，特殊字符（!@$%^-_=+[{}]:,./?），但不能包含空格。不能与用户名或者倒序用户名相同。默认取值：不涉及 login_mode

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
SET/RESET - MapReduce服务 MRS
SET/RESET - MapReduce服务 MRS

segments. <database_name>. <table_name> = < list of segment ids >” 如果用户想在多线程模式下查询指定段，可使用CarbonSession.threadSet代替SET语句。语法： “CarbonSession.threadSet

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
配置MapReduce Job基线 - MapReduce服务 MRS

mapreduce.input.fileinputformat.split.maxsize map输入信息应被拆分成的数据块的最大大小。由用户定义的分片大小的设置及每个文件block大小的设置，可以计算分片的大小。计算公式如下： splitSize = Math.max(minSize

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Spark任务提交失败 - MapReduce服务 MRS

常见的场景是使用--files上传了user.keytab，然后使用--keytab又指定了同一个文件，导致一个文件多次被上传。处理步骤问题1：重新kinit一个用户并修改相应的配置参数。问题2：查看hadoop相关的配置项是否正确，查看spark的conf目录下的core-site.xml，hdfs-site

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
设置Spark Core并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）
Kafka应用开发简介 - MapReduce服务 MRS

Topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式）

总条数： 5422

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Kafka日志介绍 - MapReduce服务 MRS

配置MapReduce Job基线 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

Storm应用开发常用概念 - MapReduce服务 MRS

数据目录SSD和HDD的配置导致建表时偶现报错 - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

如何在Hive自定义函数中操作本地文件 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

SET/RESET - MapReduce服务 MRS

配置MapReduce Job基线 - MapReduce服务 MRS

Spark任务提交失败 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线