搜索_华为云

Hive ORC数据存储优化 - MapReduce服务 MRS

as orc tblproperties ("orc.compress"="ZLIB"); xx为具体使用的Hive表名。父主题： Hive性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Spark Core数据序列化 - MapReduce服务 MRS

Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性能可以达到JavaSerializer的10倍以上，而对于一些Int之类的基本类型数据，性能的提升就几乎可以忽略。 KryoSerializer

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
加速Merge操作 - MapReduce服务 MRS
加速Merge操作 - MapReduce服务 MRS

设置的数量配额值，如果小于当前ZooKeeper目录的实际值，保存配置可成功，但是配置值不会生效，并且界面会上报告警。父主题： ClickHouse性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
优化Flink Netty网络通信参数 - MapReduce服务 MRS

操作步骤以下配置均可在客户端的“conf/flink-conf.yaml”配置文件中进行修改适配，默认已经是相对较优解，请谨慎修改，防止性能下降。 “taskmanager.network.netty.num-arenas”：默认是“taskmanager.numberOfT

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

使用CBO来自动调整连续inner join的表的个数阈值。如果超出该阈值，则不会调整join顺序。 12 父主题： Spark SQL性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
spark.yarn.executor.memoryOverhead设置不生效如何处理？ - MapReduce服务 MRS

使用新版本参数设置executor的overhead内存： spark.executor.memoryOverhead=4096 父主题：性能优化类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

得到更好的性能。 org.apache.hadoop.hbase.mapreduce.TsvImporterByteMapper 和 org.apache.hadoop.hbase.mapreduce.TsvImporterTextMapper 父主题： HBase性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
Spark SQL join优化 - MapReduce服务 MRS

Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。操作步骤在Spark SQL中进行Join操作时，可以按照以下步骤进行优化。为了方便说

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
调整Yarn任务抢占机制 - MapReduce服务 MRS

monitor.capacity.preemption.max_wait_before_kill”。取值范围：0~1。 1 父主题： Yarn性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

是Spark性能的瓶颈，I/O是Shuffle的瓶颈。配置多个磁盘则可以并行的把数据写入磁盘。如果节点中挂载多个磁盘，则在每个磁盘配置一个Spark的localDir，这将有效分散Shuffle文件的存放，提高磁盘I/O的效率。如果只有一个磁盘，配置了多个目录，性能提升效果不明显。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
建立Hive表分区提升查询效率 - MapReduce服务 MRS

dynamic.partition.mode=nonstrict; 动态分区可能导致一个DML语句创建大量的分区，对应创建大量新文件夹，对系统性能可能带来影响。在文件数量大的情况下，执行一个SQL语句启动时间较长，可以在执行SQL语句之前执行“set mapreduce.input

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
配置Flink作业状态后端冷热数据分离存储 - MapReduce服务 MRS

配置Flink作业状态后端冷热数据分离存储本章节适用于MRS 3.3.0及以后版本。在宽表关联计算场景中，每张表字段较多，导致状态后端数据量较大，严重影响状态后端性能时，可开启状态后端冷热分级存储功能。开启状态后端冷热分级存储功能步骤安装包含Flink、HBase等服务的客户端，安装路径如：/opt/hadoopclient。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

是Spark性能的瓶颈，I/O是Shuffle的瓶颈。配置多个磁盘则可以并行的把数据写入磁盘。如果节点中挂载多个磁盘，则在每个磁盘配置一个Spark的localDir，这将有效分散Shuffle文件的存放，提高磁盘I/O的效率。如果只有一个磁盘，配置了多个目录，性能提升效果不明显。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
配置Flink任务并行度 - MapReduce服务 MRS

nk-conf.yaml”文件中的“parallelism.default”配置选项来指定所有执行环境的默认并行度。父主题： Flink性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
Spark Core内存调优 - MapReduce服务 MRS

Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default.conf配置文件中，在spark.driver

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

上述压缩算法除LZC外，皆支持Native（基于C语言实现）实现，压缩和解压缩效率较高。建议根据业务场景优先选用具备Native实现的压缩算法。父主题： HDFS性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
Spark Core数据序列化 - MapReduce服务 MRS

Kryo序列化KryoSerializer 序列化对于Spark应用的性能来说，具有很大的影响。在特定的数据格式的情况下，KryoSerializer的性能可以达到JavaSerializer的10倍以上，而对于一些Int之类的基本类型数据，性能的提升就几乎可以忽略。 KryoSerializer

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
手动配置Yarn任务优先级 - MapReduce服务 MRS

priority", <priority>)或Job.setPriority(JobPriority priority)设置。父主题： Yarn性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

得到更好的性能。 org.apache.hadoop.hbase.mapreduce.TsvImporterByteMapper 和 org.apache.hadoop.hbase.mapreduce.TsvImporterTextMapper 父主题： HBase性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
配置Flink任务并行度 - MapReduce服务 MRS

nk-conf.yaml”文件中的“parallelism.default”配置选项来指定所有执行环境的默认并行度。父主题： Flink性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优

总条数： 1005

上一页
1
...
6
7
8
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive ORC数据存储优化 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

加速Merge操作 - MapReduce服务 MRS

优化Flink Netty网络通信参数 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

spark.yarn.executor.memoryOverhead设置不生效如何处理？ - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

配置Flink作业状态后端冷热数据分离存储 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

手动配置Yarn任务优先级 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

配置Flink任务并行度 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线