搜索_华为云

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出问题执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出，日志内容如下。 16/04/19 15:56:22 ERROR

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出问题执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出，日志内容如下。 16/04/19 15:56:22 ERROR

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
cache table使用指导 - MapReduce服务 MRS

SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。但需要注意的是，被cache的表会占用executor的内存。尽管在Spark SQL采用压缩存储的方式来尽量减少内存开销、缓解GC压力

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
集群生命周期管理 - MapReduce服务 MRS

台的安装部署和参数调优。 MRS服务为客户提供完全可控的大数据集群，客户在创建时可设置虚拟机的登录方式（密码或者密钥对），所创建的MRS集群资源完全归客户所用。同时MRS支持在两节点4U8G的ECS上部署大数据集群，为客户测试开发提供更多的灵活选择。 MRS集群类型包括分析集群、流式集群和混合集群。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出问题执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出，日志内容如下。 16/04/19 15:56:22 ERROR

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
规划HDFS容量 - MapReduce服务 MRS
规划HDFS容量 - MapReduce服务 MRS

中每个文件、目录和Block。 NameNode文件对象需要占用一定的内存，消耗内存大小随文件对象的生成而线性递增。DataNode实际保存的文件和目录越多，NameNode文件对象总量增加，需要消耗更多的内存，使集群现有硬件可能会难以满足业务需求，且导致集群难以扩展。规划存储

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
使用Spark小文件合并工具说明 - MapReduce服务 MRS

置。 shuffle设置对于合并功能，可粗略估计合并前后分区数的变化：一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。设置shuffle为tr

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
使用Spark小文件合并工具说明 - MapReduce服务 MRS

置。 shuffle设置对于合并功能，可粗略估计合并前后分区数的变化：一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。设置shuffle为tr

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
设置Spark Core并行度 - MapReduce服务 MRS

行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD.groupByKey(24)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
为什么在off heap时数据加载失败？ - MapReduce服务 MRS

heap时数据加载失败？回答 YARN Resource Manager将（Java堆内存 + “spark.yarn.am.memoryOverhead”）作为内存限制。因此在off heap时，内存可能会超出此限制。您需配置参数“spark.yarn.am.memoryOverhead”以增加memory。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData常见问题
Doris UDF开发规范 - MapReduce服务 MRS

UDF开发规则 UDF中方法调用必须是线程安全的。 UDF实现中禁止读取外部大文件到内存中，如果文件过大可能会导致内存耗尽。需避免大量递归调用，否则容易造成栈溢出或oom。需避免不断创建对象或数组，否则容易造成内存耗尽。 Java UDF应该捕获和处理可能发生的异常，不能将异常给服务处理

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
作业无法提交如何定位？ - MapReduce服务 MRS

1/sbin/status-oms.sh 以omm用户执行jmap -heap PID检查knox和executor进程内存使用情况，如果多次执行查看到老生代内存使用率为99.9%说明有内存溢出。查询executor进程PID：netstat -anp | grep 8181 | grep LISTEN

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
配置进程参数 - MapReduce服务 MRS

cutor-cores NUM”参数设置核数。配置Executor内存。 Executor的内存主要用于任务执行、通信等。当一个任务很大的时候，可能需要较多资源，因而内存也可以做相应的增加；当一个任务较小运行较快时，就可以增大并发度减少内存。将“spark-defaults.conf”中的“spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
IoTDB性能调优 - MapReduce服务 MRS
IoTDB性能调优 - MapReduce服务 MRS

“-XX:MaxDirectMemorySize”为IoTDB JVM直接内存，建议值为堆内存的“1/4”，主要影响写入性能，如果写入性能明显下降，可以适当调整该参数，参数值按照0.5倍速率调大。注意：需要保证“堆内存+直接内存 <= 80% * 系统可用内存”，否则会导致IoTDB启动失败。查询场景调

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB
为什么在off heap时数据加载失败？ - MapReduce服务 MRS

heap时数据加载失败？回答 YARN Resource Manager将（Java堆内存 + “spark.yarn.am.memoryOverhead”）作为内存限制，因此在off heap时，内存可能会超出此限制。您需配置“spark-defaults.conf”文件中的参数“spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存配置场景 JobHistory可使用本地磁盘缓存spark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Hudi在upsert时占用了临时文件夹中大量空间 - MapReduce服务 MRS

Hudi在upsert时占用了临时文件夹中大量空间。回答当UPSERT大量输入数据时，如果数据量达到合并的最大内存时，Hudi将溢出部分输入数据到磁盘。如果有足够的内存，请增加spark executor的内存和添加“hoodie.memory.merge.fraction”选项，如： option("hoodie

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题 > 数据写入
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存配置场景 JobHistory可使用本地磁盘缓存spark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
MRS集群反复上报43006告警 - MapReduce服务 MRS

JobHistory进程堆内存使用超出阈值”告警，且按照告警参考处理无效。问题现象集群出现告警“ALM-43006 JobHistory进程堆内存使用超出阈值”并且按照指导处理以后，运行一段时间又会出现同样的告警。原因分析可能存在JobHistory内存泄露问题，需要安装相应的补丁修复。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Hive Join数据优化 - MapReduce服务 MRS

Join时需要注意小表不能过大，如果小表将内存基本用尽，会使整个系统性能下降甚至出现内存溢出的异常。 Sort Merge Bucket Map Join 使用Sort Merge Bucket Map Join必须满足以下2个条件： join的两张表都很大，内存中无法存放。两张表都按照join

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优

总条数： 3001

上一页
1
...
8
9
10
...
151
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

集群生命周期管理 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

规划HDFS容量 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

设置Spark Core并行度 - MapReduce服务 MRS

为什么在off heap时数据加载失败？ - MapReduce服务 MRS

Doris UDF开发规范 - MapReduce服务 MRS

作业无法提交如何定位？ - MapReduce服务 MRS

配置进程参数 - MapReduce服务 MRS

IoTDB性能调优 - MapReduce服务 MRS

为什么在off heap时数据加载失败？ - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

Hudi在upsert时占用了临时文件夹中大量空间 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

MRS集群反复上报43006告警 - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线