搜索_华为云

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

行处理，每个task读取部分shuffle输出文件，再对这部分任务的Join结果进行Union操作，以达到消除数据倾斜的效果。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Spark任务提交失败 - MapReduce服务 MRS

常见的场景是使用--files上传了user.keytab，然后使用--keytab又指定了同一个文件，导致一个文件多次被上传。处理步骤问题1：重新kinit一个用户并修改相应的配置参数。问题2：查看hadoop相关的配置项是否正确，查看spark的conf目录下的core-site.xml，hdfs-site

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
设置Spark Core并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

性申请executor，因此CarbonData可获得所有节点上的executor。为了优化并行数据处理及并行读取块数据，运用动态分配的用户需配置以下特性。使用参数“spark.dynamicAllocation.executorIdleTimeout”并将此参数值设置为15min（或平均查询时间）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData故障排除
Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
Spark Core内存调优 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式）
修改CarbonData Table - MapReduce服务 MRS

TBLPROPERTIES('SORT_COLUMNS'='column1') 在执行该命令后，新的导入会使用新的SORT_COLUMNS配置值。用户可以根据查询的情况来调整SORT_COLUMNS，但是不会直接影响旧的数据。所以对历史的segments的查询性能不会受到影响，因为历史的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败用户问题使用spark-shell命令执行SQL或者spark-submit提交的Spark任务里面有SQL的load命令，并且原数据和目标表存储位置不是同一套文件系统，上述两种方式MapReduce任务启动时会报错。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
设置并行度 - MapReduce服务 MRS
设置并行度 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark开源增强特性 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
数据恢复 - MapReduce服务 MRS
数据恢复 - MapReduce服务 MRS

$Sqoop_Home：目的集群上Sqoop的安装目录。 <ip>：目的集群上数据库的IP地址。 <table_name>：待恢复的表名称。 <passwd>：hive用户的密码。 <export_from>：元数据在目的集群的HDFS地址。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

string, update_time timestamp); 其中user_group是分区列，需要根据已有数据，按更新时间进行排序，刷新用户组信息。操作步骤如下：在Hive Beeline命令行执行以下命令开启Hive动态分区： set hive.exec.dynamic.partition=true;

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

OutputMode.Complete()”语句的判断结果（outputMode的默认输出方式为“append”）。处理方法：编写应用时，用户可以根据具体情况修改数据的输出方式。将输出方式修改为“complete”，“recoverFromCheckpointLocation”

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
HBase应用开发简介 - MapReduce服务 MRS

空间，因此，表可以设计的非常稀疏。接口类型简介由于HBase本身是由java语言开发出来的，且java语言具有简洁通用易懂的特性，推荐用户使用java语言进行HBase应用程序开发。 HBase采用的接口与Apache HBase保持一致，请参见：http://hbase.apache

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Kudu应用开发常用概念 - MapReduce服务 MRS

server会定期向master发送心跳。 Kudu Kudu的管理工具，可以用来检查集群的健康状况、日常运维等操作。 keytab文件存放用户信息的密钥文件，应用程序采用此密钥文件在组件中进行API方式认证。 Schema 表信息，用来表示表中列的信息。父主题： Kudu应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kudu开发指南（安全模式） > Kudu应用开发概述
Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

OutputMode.Complete()”语句的判断结果（outputMode的默认输出方式为“append”）。处理方法：编写应用时，用户可以根据具体情况修改数据的输出方式。将输出方式修改为“complete”，“recoverFromCheckpointLocation”

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
TRUNCATE TABLE - MapReduce服务 MRS
TRUNCATE TABLE - MapReduce服务 MRS

partition_col_value, partition_column = partition_col_value, ...) 描述从表或分区中移除所有行。用户可以通过partition_spec一次性删除分区表的多个分区，如果不指定就一次清除分区表的所有分区。当表属性“auto.purge”采用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）

总条数： 5520

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

Spark任务提交失败 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

为什么并行度大于待处理的block数目时，CarbonData仍需要额外的executor？ - MapReduce服务 MRS

Spark跨源复杂数据的SQL查询优化 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

修改CarbonData Table - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

设置并行度 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

数据恢复 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

Kudu应用开发常用概念 - MapReduce服务 MRS

Structured Streaming的cluster模式，在数据处理过程中终止ApplicationManager，应用失败 - MapReduce服务 MRS

TRUNCATE TABLE - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线