搜索_华为云

HBase JVM参数优化说明 - MapReduce服务 MRS

HBase JVM参数优化说明操作场景当集群数据量达到一定规模后，JVM的默认配置将无法满足集群的业务需求，轻则集群变慢，重则集群服务不可用。所以需要根据实际的业务情况进行合理的JVM参数配置，提高集群性能。操作步骤参数入口： HBase角色相关的JVM参数需要配置在安装

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
ALM-12190 Knox连接数超过阈值 - MapReduce服务 MRS

产生告警的集群或系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名称拓扑名产生告警的Knox拓扑名称对系统的影响 Knox高出阈值的拓扑存在连接满的可能，连接满后无法正常提供请求转发功能，影响整个MRS使用。可能原因用户大量使用Hue或

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

合并CBO优化操作场景 Spark SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

合并CBO优化操作场景 Spark SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响系统性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

小文件优化操作场景 Spark SQL表中，经常会存在很多小文件（大小远小于HDFS的块大小），每个小文件默认对应Spark中的一个Partition，即一个Task。在有很多小文件时，Spark会启动很多Task，此时当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响系统性能。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
访问Storm的WebUI - MapReduce服务 MRS

UI”，单击任意一个UI链接，打开Storm的WebUI。相关任务单击拓扑名称，可查看指定拓扑的详细信息、拓扑状态、Spouts信息、Bolts信息和拓扑配置。在“Topology actions”区域，用户可以对拓扑执行激活、去激活、重部署、删除操作、调试、停止调试和修改日志级别，即“Activate”、“

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
Hive Join数据优化 - MapReduce服务 MRS

Hive Join数据优化操作场景使用Join语句时，如果数据量大，可能造成命令执行速度和查询速度慢，此时可进行Join优化。 Join优化可分为以下方式： Map Join Sort Merge Bucket Map Join Join顺序优化 Map Join Hive的Map

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Hive Join数据优化 - MapReduce服务 MRS

Hive Join数据优化操作场景使用Join语句时，如果数据量大，可能造成命令执行速度和查询速度慢，此时可进行Join优化。 Join优化可分为以下方式： Map Join Sort Merge Bucket Map Join Join顺序优化 Map Join Hive的Map

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive SQL逻辑优化 - MapReduce服务 MRS

Hive SQL逻辑优化操作场景在Hive上执行SQL语句查询时，如果语句中存在“(a&b) or (a&c)”逻辑时，建议将逻辑改为“a & (b or c)”。样例假设条件a为“p_partkey = l_partkey”，优化前样例如下所示： select

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Datasource表优化 - MapReduce服务 MRS

Datasource表优化操作场景将datasource表的分区消息存储到Metastore中，并在Metastore中对分区消息进行处理。优化datasource表，支持对表中分区执行增加、删除和修改等语法，从而增加与Hive的兼容性。支持在查询语句中，把分区裁剪并下压

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Spark SQL join优化 - MapReduce服务 MRS

join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化。为了方便说明，设表A和表B，且A、B表都有个名为name的列。对A、B表进行join操作。估计表的大小。根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark SQL join优化 - MapReduce服务 MRS

join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化。为了方便说明，设表A和表B，且A、B表都有个名为name的列。对A、B表进行join操作。估计表的大小。根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Spark SQL join优化 - MapReduce服务 MRS

join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化。为了方便说明，设表A和表B，且A、B表都有个名为name的列。对A、B表进行join操作。估计表的大小。根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看表的大小。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
聚合算法优化 - MapReduce服务 MRS

要启动聚合算法优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.codegen.aggregate.map.twolevel.enabled 是否开启聚合算法优化： true：开启 false：不开启

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量配置场景本章节适用于MRS 3.x及后续版本。数个成品Hadoop集群由于NameNode超负荷运行并失去响应而发生故障。这种阻塞现象是由于Hadoop的初始设计造成的。在Hadoop中，NameNode作为单独的机器，在其

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
聚合算法优化 - MapReduce服务 MRS

要启动聚合算法优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.codegen.aggregate.map.twolevel.enabled 是否开启聚合算法优化： true：开启 false：不开启

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Storm性能调优 - MapReduce服务 MRS
Storm性能调优 - MapReduce服务 MRS

本章节适用于MRS 3.x及后续版本。修改服务配置参数，请参考修改集群服务配置参数。拓扑调优当需要提升Storm数据量处理性能时，可以通过拓扑调优的操作提高效率。建议在可靠性要求不高的场景下进行优化。表1 调优参数配置参数默认值调优场景 topology.acker.executors

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm > 性能调优

总条数： 3839

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HBase JVM参数优化说明 - MapReduce服务 MRS

ALM-12190 Knox连接数超过阈值 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

访问Storm的WebUI - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Hive SQL逻辑优化 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Datasource表优化 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

优化HDFS NameNode RPC的服务质量 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

Storm性能调优 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线