搜索_华为云

Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

spark-sql退出时打印RejectedExecutionException异常栈问题执行大数据量的Spark任务（如2T的TPCDS测试套），任务运行成功后，在spark-sql退出时概率性出现RejectedExecutionException的异常栈信息，相关日志如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Hive Group By语句优化 - MapReduce服务 MRS

Hive Group By语句优化操作场景优化Group by语句，可提升命令执行速度和查询速度。 Group by的时候， Map端会先进行分组，分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
Hudi Clustering操作说明 - MapReduce服务 MRS

即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

spark-sql退出时打印RejectedExecutionException异常栈问题执行大数据量的Spark任务（如2T的TPCDS测试套），任务运行成功后，在spark-sql退出时概率性出现RejectedExecutionException的异常栈信息，相关日志如下所示：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Hudi Clustering操作说明 - MapReduce服务 MRS

即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
MRS集群节点如何进行操作系统漏洞升级 - MapReduce服务 MRS

MRS集群节点如何进行操作系统漏洞升级用户问题 EulerOS系统底层存在漏洞时，MRS集群如何进行操作系统漏洞升级？问题现象在使用安全软件测试集群时，发现有EulerOS系统底层存在漏洞。原因分析 MRS集群内服务部署在EulerOS系统中，因此需要进行漏洞升级。处理步骤修

 帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
Flink性能调优规则 - MapReduce服务 MRS

在事实表与维度表关联场景中可以按表设置TTL降低状态后端数据量具体使用指导参考通过表级TTL进行状态后端优化。合理设置并行度任务运行的速度和并行度相关，一般来说提升并行度能有效提升读取的速度，但是过大的并行度可能导致部分节点资源的浪费，过小的并行度可能导致部分节点运行缓慢。对于SQL当前不能手动指定每

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
管理Loader连接（MRS 3.x之前版本） - MapReduce服务 MRS

编辑连接在Loader页面，单击“管理连接”。单击指定连接的名称，进入编辑页面。根据业务需要，修改连接配置参数。单击“测试”。如果显示测试成功，则执行5；如果显示不能连接至OBS Server，则需要重复3。单击“保存”。如果某个Loader作业已集成一个Load

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 服务 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
如何使用IDEA远程调试业务 - MapReduce服务 MRS

address=5055,suspend=n,server=y，保存配置后重启相关实例。调试Storm程序需要先修改指定的服务端参数，并在重启服务后生效，建议在测试环境上进行调测。提交拓扑后，在Storm UI上进入到Topology界面，再单击进入要调试组件界面。图1 进入拓扑的Component界面

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
批量写入Hudi表 - MapReduce服务 MRS

和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区，因此它的速度比UPSERT快。当数据源不包含更新数据时建议使用该操作，若数据源中存在更新数据，则在数据湖中会出现重复数据。 BULK_INSERT（批量插入）：用于初始数据集加载，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
配置SparkSQL的分块个数 - MapReduce服务 MRS

length exceeds 2147483647: 2717729270 - discarded 例如，SparkSQL运行TPCDS 500G的测试时，使用默认配置出现错误。所以当数据量较大时需要适当的调整该参数。配置参数参数入口：在Manager系统中，选择“集群 > 待操作集群的名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
如何使用IDEA远程调试业务 - MapReduce服务 MRS

address=5055,suspend=n,server=y，保存配置后重启相关实例。调试Storm程序需要先修改指定的服务端参数，并在重启服务后生效，建议在测试环境上进行调测。提交拓扑后，在Storm UI上进入到Topology界面，再单击进入要调试组件界面。图1 进入拓扑的Component界面

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
批量写入Hudi表 - MapReduce服务 MRS

和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具体更新的文件分区，因此它的速度比UPSERT快。当数据源不包含更新数据时建议使用该操作，如果数据源中存在更新数据，则在数据湖中会出现重复数据。 BULK_INSERT（批量插入）：用于初始数据集加载，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
按需计费 - MapReduce服务 MRS
按需计费 - MapReduce服务 MRS

按需计费是一种先使用再付费的计费模式，适用于无需任何预付款或长期承诺的用户。本文将介绍按需计费MRS集群的计费规则。适用场景集群用于前期程序研发或功能测试。资源使用有临时性和突发性。计费周期按需计费MRS集群按秒计费，每一个小时整点结算一次费用（以UTC+8时间为准），结算完毕后进入新

 帮助中心 > MapReduce服务 MRS > 计费说明 > 计费模式
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

ark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

ark应用的历史数据，以防止JobHistory内存中加载大量应用数据，减少内存压力，同时该部分缓存数据可以复用以提高后续对相同应用的访问速度。配置参数登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索以下参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

发送到每个partition可以提升处理的速度。在partition数据均匀分布的情况下，同时提高partition和executor个数，将会提升Spark处理速度（当partition个数和executor个数保持一致时，处理速度是最快的）。在partition数据均匀分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Streaming
快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

域相关参数，参数详情可参考创建HetuEngine计算实例章节或保持默认值即可。创建计算实例时的默认配置只申请极少量的资源，仅供基本功能测试。用户需要根据实际业务需求和可用资源进行参数配置，可参考配置HetuEngine资源组和配置HetuEngine Worker节点数量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine

总条数： 351

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive Group By语句优化 - MapReduce服务 MRS

spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

spark-sql退出时打印RejectedExecutionException异常栈 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

MRS集群节点如何进行操作系统漏洞升级 - MapReduce服务 MRS

Flink性能调优规则 - MapReduce服务 MRS

管理Loader连接（MRS 3.x之前版本） - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

按需计费 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

配置JobHistory本地磁盘缓存 - MapReduce服务 MRS

运行Spark Streaming任务参数调优的注意事项 - MapReduce服务 MRS

快速使用HetuEngine访问Hive数据源 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线