搜索_华为云

Spark Core内存调优 - MapReduce服务 MRS

点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Kafka应用开发简介 - MapReduce服务 MRS

topic中获取消息的角色称为Consumer。 Broker Kafka集群中的每一个节点服务器称为Broker。 keytab file 存放用户信息的密钥文件。应用程序采用此密钥文件在集群中进行API方式认证。父主题： Kafka开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式）
Spark开源增强特性 - MapReduce服务 MRS

over inner join、aggregate over union all等。为应对不同应用场景的特殊需求，对所有下推模块设计开关功能，用户可以自行配置是否应用上述查询下推的增强。表1 跨源查询增加特性对比模块增强前增强后 aggregate 不支持aggregate下推

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
数据恢复 - MapReduce服务 MRS
数据恢复 - MapReduce服务 MRS

$Sqoop_Home：目的集群上Sqoop的安装目录。 <ip>：目的集群上数据库的IP地址。 <table_name>：待恢复的表名称。 <passwd>：hive用户的密码。 <export_from>：元数据在目的集群的HDFS地址。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
创建集群 - MapReduce服务 MRS
创建集群 - MapReduce服务 MRS

子网所在VPC名称。通过VPC管理控制台获取名称：登录VPC管理控制台。单击“虚拟私有云”，从左侧列表选择虚拟私有云。在“虚拟私有云”页面的列表中即可获取VPC名称。约束限制：不涉及取值范围：不涉及默认取值：不涉及 subnet_id 否 String 参数解释：

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
HBase应用开发简介 - MapReduce服务 MRS

空间，因此，表可以设计的非常稀疏。接口类型简介由于HBase本身是由java语言开发出来的，且java语言具有简洁通用易懂的特性，推荐用户使用java语言进行HBase应用程序开发。 HBase采用的接口与Apache HBase保持一致。 HBase通过接口调用，可提供的功能如表1所示。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发概述
HBase应用开发简介 - MapReduce服务 MRS

空间，因此，表可以设计的非常稀疏。接口类型简介由于HBase本身是由java语言开发出来的，且java语言具有简洁通用易懂的特性，推荐用户使用java语言进行HBase应用程序开发。 HBase采用的接口与Apache HBase保持一致。 HBase通过接口调用，可提供的功能如表1所示。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发概述
通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

通过Sqoop读取MySQL数据并写parquet文件到OBS时失败用户问题通过Sqoop读取MySQL数据，然后直接写到OBS，指定parquet格式时写入报错，不指定parquet时不报错。问题现象原因分析 parquet格式不支持hive3，用Hcatalog方式写入。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Sqoop
如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

string, update_time timestamp); 其中user_group是分区列，需要根据已有数据，按更新时间进行排序，刷新用户组信息。操作步骤如下：在Hive Beeline命令行执行以下命令开启Hive动态分区： set hive.exec.dynamic.partition=true;

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive故障排除
Superior Scheduler REST API接口介绍 - MapReduce服务 MRS

N或CLOSED。CLOSED状态的队列不接受任何新的allocation请求。 eopen_state String 队列的外在状态（父队列状态）。有效状态为队列自身状态及其父队列状态的组合。CLOSED状态的队列不接受任何新的allocation请求。 active_state

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > YARN开发指南（普通模式） > YARN接口介绍
Spark CBO调优 - MapReduce服务 MRS
Spark CBO调优 - MapReduce服务 MRS

Null)和Histogram（支持等宽直方图）。 CBO调优自动优化：用户根据自己的业务场景，输入SQL语句查询，程序会自动去判断输入的SQL语句是否符合优化的场景，从而自动选择Join优化算法。手动优化：用户可以通过DESC FORMATTED src命令查看统计信息，根据统计信息的分布，人工优化SQL语句。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优
在本地Windows中调测HDFS程序 - MapReduce服务 MRS

Configurations”，在弹出的会话框中设置运行用户。 -DHADOOP_USER_NAME=test 图1 参数配置用户可向管理员咨询运行用户。test在这里只是举例，若需运行Colocation相关操作的样例代码，则此用户需属于supergroup用户组。若已按照1设置环境变量，则直接

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 调测HDFS应用
当事件队列溢出时如何配置事件队列的大小 - MapReduce服务 MRS

produced in 5000 ms, eventQueue still has 86417 events, MaxSize: 171764. 用户可以根据日志信息【队列中消息数量的最大值MaxSize】，在配置文件“spark-defaults.conf”中将配置项“spark.eventQueue

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
执行复杂SQL语句时报“Code of method ... grows beyond 64 KB”的错误 - MapReduce服务 MRS

when语句），这种情况下，通过codegen生成的Java代码中函数的大小就可能会超过64KB，从而导致编译失败。规避措施：当出现上述问题时，用户可以通过关闭钨丝计划，关闭使用codegen的方式来生成Java代码的功能，从而确保语句的正常执行。即在客户端的“spark-defaults

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

d命令行中加入如下参数。表1 增强BulkLoad效率的配置项参数描述配置的值 -Dimporttsv.mapper.class 用户自定义mapper通过把键值对的构造从mapper移动到reducer以帮助提高性能。mapper只需要把每一行的原始文本发送给reduc

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
配置Spark事件队列大小 - MapReduce服务 MRS

因此当队列存放的速度大于获取的速度时，就会导致队列溢出，从而丢失了溢出的事件，影响了UI、EventLog、动态资源调度等功能。所以为了更灵活的使用，在这边添加一个配置项，用户可以根据Driver的内存大小设置合适的值。配置描述参数入口：在执行应用之前，在Spark服务配置中修改。在Manager系统中，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
在本地Windows环境中调测HetuEngine应用 - MapReduce服务 MRS

IDEA开发环境中，确认配置HetuEngine应用安全认证中得到的“user.keytab”和“krb5.conf”文件放到“resources”目录下，并根据实际路径和用户名修改“jaas-zk.conf”文件中的配置参数。图1 将认证文件放置在resources目录下单击IDEA右侧Maven导入依赖。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 调测HetuEngine应用
配置Spark事件队列大小 - MapReduce服务 MRS

因此当队列存放的速度大于获取的速度时，就会导致队列溢出，从而丢失了溢出的事件，影响了UI、EventLog、动态资源调度等功能。所以为了更灵活的使用，在这边添加一个配置项，用户可以根据Driver的内存大小设置合适的值。配置描述参数入口：在执行应用之前，在Spark服务配置中修改。在Manager系统中，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
当事件队列溢出时如何配置事件队列的大小 - MapReduce服务 MRS

produced in 5000 ms, eventQueue still has 86417 events, MaxSize: 171764. 用户可以根据日志信息【队列中消息数量的最大值MaxSize】，在配置文件“spark-defaults.conf”中将配置项“spark.eventQueue

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Storm-HBase开发指引 - MapReduce服务 MRS

if(args.length >= 2) { //用户更改了默认的keytab文件名，这里需要将新的keytab文件名通过参数传入 conf.put(Config.STORM_CLIENT_KEYTAB_FILE,

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题

总条数： 3872

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Core内存调优 - MapReduce服务 MRS

Kafka应用开发简介 - MapReduce服务 MRS

Spark开源增强特性 - MapReduce服务 MRS

数据恢复 - MapReduce服务 MRS

创建集群 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

通过Sqoop读取MySQL数据并写parquet文件到OBS时失败 - MapReduce服务 MRS

如何对insert overwrite自读自写场景进行优化 - MapReduce服务 MRS

Superior Scheduler REST API接口介绍 - MapReduce服务 MRS

Spark CBO调优 - MapReduce服务 MRS

在本地Windows中调测HDFS程序 - MapReduce服务 MRS

当事件队列溢出时如何配置事件队列的大小 - MapReduce服务 MRS

执行复杂SQL语句时报“Code of method ... grows beyond 64 KB”的错误 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

配置Spark事件队列大小 - MapReduce服务 MRS

在本地Windows环境中调测HetuEngine应用 - MapReduce服务 MRS

配置Spark事件队列大小 - MapReduce服务 MRS

当事件队列溢出时如何配置事件队列的大小 - MapReduce服务 MRS

Storm-HBase开发指引 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线