搜索_华为云

完整迁移Storm业务 - MapReduce服务 MRS

如果是非maven工程，则手动收集如上jar包，添加到工程的classpath中。修改拓扑提交部分代码，下面以WordCount为例： Storm拓扑的构造部分保持不变，无需修改，包括使用Storm API开发的Spout和Bolt都无需修改。 TopologyBuilder builder =

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm > 迁移Storm业务至Flink
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
Spark Distinct聚合优化 - MapReduce服务 MRS

由cube等引起的数据膨胀多少倍时，触发该优化。需要配置一个大于0的数值来启用。例如1024，代表数据膨胀1024倍及以上时，触发该优化。 -1 spark.sql.distinct.aggregator.enabled 是否强制开启distinct聚合优化。开启时，将不再受限于数据膨胀倍

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Hive ORC数据存储优化 - MapReduce服务 MRS

ORC数据存储优化操作场景 “ORC”是一种高效的列存储格式，在压缩比和读取效率上优于其他文件格式。建议使用“ORC”作为Hive表默认的存储格式。前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Alluxio样例程序开发思路 - MapReduce服务 MRS

通过典型场景，可以快速学习和掌握Alluxio的开发过程，并对关键的接口函数有所了解。 Alluxio的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件和对文件的读写；Alluxio还有其他的业务处理，例如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南 > 开发Alluxio应用
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明通过典型场景，可以快速学习和掌握HDFS的开发过程，并对关键的接口函数有所了解。 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文件

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
CarbonData首查优化工具 - MapReduce服务 MRS

CarbonData首查优化工具工具介绍 CarbonData 的首次查询较慢，对于实时性要求较高的节点可能会造成一定的时延。本工具主要提供以下功能：对查询时延要求较高的表进行首次查询预热。工具使用下载安装客户端，例如安装目录为“/opt/client”。进入目录“/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

调整HetuEngine INSERT写入优化 HetuEngine向Hive数据源分区表写入数据时，需要根据实际业务的查询结果中分区列数量添加相关自定义配置，以获得最佳的性能效果。调整HetuEngine INSERT写入步骤使用HetuEngine管理员用户登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
CarbonData首查优化工具 - MapReduce服务 MRS

CarbonData首查优化工具工具介绍 CarbonData的首次查询较慢，对于实时性要求较高的节点可能会造成一定的时延。本工具主要提供以下功能：对查询时延要求较高的表进行首次查询预热。工具使用下载安装客户端，例如安装目录为“/opt/client”。进入目录“/op

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
创建Strom Bolt - MapReduce服务 MRS
创建Strom Bolt - MapReduce服务 MRS

创建Strom Bolt 功能介绍所有的消息处理逻辑都被封装在各个Bolt中。Bolt包含多种功能：过滤、聚合等等。如果Bolt之后还有其他拓扑算子，可以使用OutputFieldsDeclarer.declareStream定义Stream，使用OutputCollector.emit来选择要发射的Stream。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > 开发Storm应用
使用旧插件storm-kafka时如何正确设置offset - MapReduce服务 MRS

场景：场景1 当拓扑运行后，KafkaSpout会将offset存放在ZooKeeper路径：“/{zkRoot}/{id}/{partitionId}”下，其中“zkRoot”和“id”是用户指定的，“partitionId”是自动获取的。默认情况下，拓扑在启动后会先从Zoo

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

BO正确的优化。 CBO优化器会基于统计信息和查询条件，尽可能地使join顺序达到合适。但是也可能存在特殊情况导致join顺序调整不准确。例如数据存在倾斜，以及查询条件值在表中不存在等场景，可能调整出非优化的join顺序。开启列统计信息自动收集时，需要在reduce侧做聚合统计

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
创建Storm Bolt - MapReduce服务 MRS
创建Storm Bolt - MapReduce服务 MRS

创建Storm Bolt 功能介绍所有的消息处理逻辑都被封装在各个Bolt中。Bolt包含多种功能：过滤、聚合等。如果Bolt之后还有其他拓扑算子，可以使用OutputFieldsDeclarer.declareStream定义Stream，使用OutputCollector.emit来选择要发射的Stream。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > 开发Storm应用
创建Storm Bolt - MapReduce服务 MRS
创建Storm Bolt - MapReduce服务 MRS

创建Storm Bolt 功能介绍所有的消息处理逻辑都被封装在各个Bolt中。Bolt包含多种功能：过滤、聚合等等。如果Bolt之后还有其他拓扑算子，可以使用OutputFieldsDeclarer.declareStream定义Stream，使用OutputCollector.emit来选择要发射的Stream。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 开发Storm应用
从零开始使用Storm - MapReduce服务 MRS

Storm用户执行以下命令，提交Storm拓扑： storm jar 拓扑包路径拓扑Main方法的类名称拓扑名称界面提示以下信息表示提交成功： Finished submitting topology: topo1 执行以下命令，查看Storm中的拓扑。启用Kerberos认证的集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
如何配置MRS集群knox内存？ - MapReduce服务 MRS

在其他Master节点上重复执行如上步骤。执行ps -ef |grep knox命令可查看已设置的内存信息。图1 knox内存父主题：性能优化类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
如何提高Presto资源使用率？ - MapReduce服务 MRS

实际情况调大。单击“保存”，保存配置，重启Presto服务。 Presto重启会导致服务不可用，请在业务空闲期间重启服务。父主题：性能优化类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
优化Flink Netty网络通信参数 - MapReduce服务 MRS

cp_[rw]mem) ，一般为4MB，表示netty的发送和接收的缓冲区大小。 “taskmanager.network.netty.transport”：默认为“nio”方式，表示netty的传输方式，有“nio”和“epoll”两种方式。父主题： Flink性能调优

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
动态分区插入场景内存优化 - MapReduce服务 MRS

动态分区插入场景内存优化操作场景 SparkSQL在往动态分区表中插入数据时，分区数越多，单个Task生成的HDFS文件越多，则元数据占用的内存也越多。这就导致程序GC（Gabage Collection）严重，甚至发生OOM（Out of Memory）。经测试证明：102

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优

总条数： 3839

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

完整迁移Storm业务 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

Spark Distinct聚合优化 - MapReduce服务 MRS

Hive ORC数据存储优化 - MapReduce服务 MRS

Alluxio样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

CarbonData首查优化工具 - MapReduce服务 MRS

调整HetuEngine INSERT写入优化 - MapReduce服务 MRS

CarbonData首查优化工具 - MapReduce服务 MRS

创建Strom Bolt - MapReduce服务 MRS

使用旧插件storm-kafka时如何正确设置offset - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

创建Storm Bolt - MapReduce服务 MRS

创建Storm Bolt - MapReduce服务 MRS

从零开始使用Storm - MapReduce服务 MRS

如何配置MRS集群knox内存？ - MapReduce服务 MRS

如何提高Presto资源使用率？ - MapReduce服务 MRS

优化Flink Netty网络通信参数 - MapReduce服务 MRS

动态分区插入场景内存优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线