搜索_华为云

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33:34

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

10亿级数据量场景的解决方案有哪些？问： 10亿级数据量场景的解决方案有哪些？答：有数据更新、联机事务处理OLTP、复杂分析的场景，建议使用云数据库 GaussDB(for MySQL)。 MRS的Impala + Kudu也能满足该场景，Impala + Kudu可以在j

帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
Kafka集群节点内多磁盘数据量占用高 - MapReduce服务 MRS

ms所规定时间之后开始执行删，可以通过查看kafka的server.log检索是否有delete字段来判断删除操作是否生效，有delete字段则表示已经生效，也可以通过执行df -h命令查看磁盘的数据量占用情况判断设置是否生效。父主题：使用Kafka

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
Hive查询数据是否支持导出？ - MapReduce服务 MRS

Hive查询数据是否支持导出？问： MRS集群Hive组件的查询数据是否支持导出？答： Hive查询数据支持导出，请参考如下语句进行导出： insert overwrite local directory "/tmp/out/" row format delimited fields

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

Broker Load导入任务的数据量超过阈值现象描述使用Broker Load导入数据时报错： Scan bytes per broker scanner exceed limit:xxx 原因分析 BE处理的单个导入任务的最大数据量为3GB，超过该值的待导入文件需要通过调整Broker

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doirs故障排除
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33:34

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
ALM-45617 CDL复制槽Slot积压数据量超过阈值 - MapReduce服务 MRS

CDL复制槽Slot积压数据量超过阈值告警解释 PostgreSQL或Opengauss（适用于MRS 3.3.0及之后版本）积压过多的WAL日志，可能导致PostgreSQL或Opengauss磁盘空间耗尽。系统每5分钟检查CDL任务配置的复制槽Slot积压数据量是否超过阈值，如果是

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
MapReduce Shuffle调优 - MapReduce服务 MRS

extends Reducer> cls) 为Job设置一个Combiner类。 Copy阶段的调优数据是否压缩：对Map的中间结果进行压缩，当数据量大时，会显著减少网络传输的数据量，但是也因为多了压缩和解压，带来了更多的CPU消耗。因此需要做好权衡。当任务属于网络瓶颈类型时，压缩

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象问题背景与现象当数据量较大时会频繁地发生rebalance导致出现重复消费的情况，关键日志如下： 2018-05-12 10:58:42,561 | INFO | [kafka-request-handler-3] | [GroupCoordinator

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？ - MapReduce服务 MRS

如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？问题如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？原因分析由于窗口使用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题
Flink on Hudi作业参数规则 - MapReduce服务 MRS

根据实际情况而定 Checkpoint间隔时长大于Checkpoint执行时长 checkpoint执行时长视checkpoint的数据量相关，数据量越大实行耗时越大 Checkpoint超时时长大于Checkpoint间隔时长 Checkpoint间隔时长是指多长时间触发一次Checkp

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

从NodeManager中获取数据，当数据量达到一个级别（10T级别），会出现NodeManager单点瓶颈（ShuffleService服务在NodeManager进程中），就会出现某些Task获取数据超时，从而出现该问题。因此，当数据量达到10T级别以上的Spark任务，建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
Hive Group By语句优化 - MapReduce服务 MRS

分组完后分发到Reduce端， Reduce端再进行分组。可采用Map端聚合的方式来进行Group by优化，开启Map端初步聚合，减少Map的输出数据量。操作步骤在Hive客户端进行如下设置： set hive.map.aggr=true; 注意事项 Group By数据倾斜 Group

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
BE运行数据导入或查询任务报错 - MapReduce服务 MRS

brpc_socket_max_unwritten_bytes：用于设置未发送的数据量的阈值，默认为1GB。如果未发送数据量超过该值，则会报OVERCROWDED错，可适当调大该值。 tablet_writer_ignore_eovercrowded：是否忽略数据导入过程中出现的OVERCROWDED错误，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hadoop集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能有差

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hive集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。使用华为云CDM服务“场景迁移功能”可以一键式便捷地完成Hive数据的迁移。本章节以通过华为云CDM服务

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云HBase集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能有差

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

在大数据应用，尤其是实时分析处理数据的场景中，常常需要根据数据量的变化动态调整集群节点数量以增减资源。MRS的弹性伸缩规则功能支持根据集群负载对集群的Task节点进行弹性伸缩。如果数据量是按照周期进行有规律的变化，用户可以按照固定时间段来自动调整Task节点数量范围，从而在数据量变化前提前完成集群的扩缩容。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
Flink SQL逻辑开发规则 - MapReduce服务 MRS

JOIN table3 AS t3 ON o.order_id = t3.id; 关联嵌套层级不超过三层嵌套层级越多，回撤流的的数据量越大。【示例】关联嵌套3层： SELECT * FROM table1 WHERE column1 IN ( SELECT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范

总条数： 2252

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

10亿级数据量场景的解决方案有哪些？ - MapReduce服务 MRS

Kafka集群节点内多磁盘数据量占用高 - MapReduce服务 MRS

Hive查询数据是否支持导出？ - MapReduce服务 MRS

Broker Load导入任务的数据量超过阈值 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

ALM-45617 CDL复制槽Slot积压数据量超过阈值 - MapReduce服务 MRS

MapReduce Shuffle调优 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

如何处理checkpoint设置RocksDBStateBackend方式，且当数据量大时，执行checkpoint会很慢的问题？ - MapReduce服务 MRS

Flink on Hudi作业参数规则 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

由于Timeout waiting for task异常导致Shuffle FetchFailed - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

BE运行数据导入或查询任务报错 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

MRS集群Task节点弹性伸缩概述 - MapReduce服务 MRS

Flink SQL逻辑开发规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线