搜索_华为云

spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

spark-sql退出时打印RejectedExecutionException异常栈问题执行大数据量的Spark任务（如2T的TPCDS测试套），任务运行成功后，在spark-sql退出时概率性出现RejectedExecutionException的异常栈信息，相关日志如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
CLEANARCHIVE - MapReduce服务 MRS
CLEANARCHIVE - MapReduce服务 MRS

本章节内容仅适用于MRS 3.2.1-LTS至MRS 3.3.1-LTS版本。命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式 set hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存配置场景 JobHistory可使用本地磁盘缓存spark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
MRS集群节点如何进行操作系统漏洞升级 - MapReduce服务 MRS

MRS集群节点如何进行操作系统漏洞升级用户问题 EulerOS系统底层存在漏洞时，MRS集群如何进行操作系统漏洞升级？问题现象在使用安全软件测试集群时，发现有EulerOS系统底层存在漏洞。原因分析 MRS集群内服务部署在EulerOS系统中，因此需要进行漏洞升级。处理步骤修

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
CLEAN - MapReduce服务 MRS
CLEAN - MapReduce服务 MRS

0及之后版本。命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
管理Loader连接（MRS 3.x之前版本） - MapReduce服务 MRS

编辑连接在Loader页面，单击“管理连接”。单击指定连接的名称，进入编辑页面。根据业务需要，修改连接配置参数。单击“测试”。如果显示测试成功，则执行5；如果显示不能连接至OBS Server，则需要重复3。单击“保存”。如果某个Loader作业已集成一个Load

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存配置场景 JobHistory可使用本地磁盘缓存spark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
MemArtsCC与其他组件的关系 - MapReduce服务 MRS

SMemArtsCCInputStream，该InputStream从部署在计算侧上的MemArtsCC集群读取数据，从而减少OBS服务端压力，提升数据读取性能的目标。 MemArtsCC会将数据持久化存储到计算侧的存储中（SSD），OBS对接MemArtsCC有如下使用场景：提升存算分离架构访问数据的性能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
创建CarbonData Table的建议 - MapReduce服务 MRS

创建CarbonData Table的建议操作场景本章节根据超过50个测试用例总结得出建议，帮助用户创建拥有更高查询性能的CarbonData表。表1 CarbonData表中的列 Column name Data type Cardinality Attribution msname

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
如何使用IDEA远程调试业务 - MapReduce服务 MRS

address=5055,suspend=n,server=y，保存配置后重启相关实例。调试Storm程序需要先修改指定的服务端参数，并在重启服务后生效，建议在测试环境上进行调测。提交拓扑后，在Storm UI上进入到Topology界面，再单击进入要调试组件界面。图1 进入拓扑的Component界面

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
创建高查询性能的CarbonData表 - MapReduce服务 MRS

创建高查询性能的CarbonData表操作场景本章节根据超过50个测试用例总结得出建议，帮助用户创建拥有更高查询性能的CarbonData表。表1 CarbonData表中的列 Column name Data type Cardinality Attribution msname

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 服务 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
如何使用IDEA远程调试业务 - MapReduce服务 MRS

address=5055,suspend=n,server=y，保存配置后重启相关实例。调试Storm程序需要先修改指定的服务端参数，并在重启服务后生效，建议在测试环境上进行调测。提交拓扑后，在Storm UI上进入到Topology界面，再单击进入要调试组件界面。图1 进入拓扑的Component界面

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
cache table使用指导 - MapReduce服务 MRS

SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。但需要注意的是，被cache的表会占用executor的内存。尽管在Spark SQL采用压缩存储的方式来尽量减少内存开销、缓解GC压力，但当缓存的表较大或者缓存表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
cache table使用指导 - MapReduce服务 MRS

SQL可以将表cache到内存中，并且使用压缩存储来尽量减少内存压力。通过将表cache，查询可以直接从内存中读取数据，从而减少读取磁盘带来的内存开销。但需要注意的是，被cache的表会占用executor的内存。尽管在Spark SQL采用压缩存储的方式来尽量减少内存开销、缓解GC压力，但当缓存的表较大或者缓存表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

本章节适用于MRS 3.5.0及以后版本。当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Hudi数据表Archive规范 - MapReduce服务 MRS

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Hudi数据表Clean规范 - MapReduce服务 MRS

要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。对于Hudi的MOR、COW表，都需要开启Clean。 Hudi表在写入数据时会自动判断是否需要

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Flink SQL逻辑开发规则 - MapReduce服务 MRS

proc_time AS t5 ON o.order_id = t5.id; 多流Join场景流表个数不超过三个当Join表过多时，状态后端压力太大会导致端到端时延增加。【示例】实时Join维表数3个： CREATE TABLE table1(id int, param1 string)

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范

总条数： 304

上一页
1
2
3
4
5
...
16
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

CLEANARCHIVE - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

MRS集群节点如何进行操作系统漏洞升级 - MapReduce服务 MRS

CLEAN - MapReduce服务 MRS

管理Loader连接（MRS 3.x之前版本） - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 - MapReduce服务 MRS

创建CarbonData Table的建议 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

创建高查询性能的CarbonData表 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

cache table使用指导 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

Hudi数据表Clean规范 - MapReduce服务 MRS

Flink SQL逻辑开发规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线