搜索_华为云

合并CarbonData表Segments - MapReduce服务 MRS

合并CarbonData表Segments 操作场景频繁的数据获取导致在存储目录中产生许多零碎的CarbonData文件。由于数据排序只在每次加载时进行，所以，索引也只在每次加载时执行。这意味着，对于每次加载都会产生一个索引，随着数据加载数量的增加，索引的数量也随之增加。由于每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
Hive Join数据优化 - MapReduce服务 MRS

Hive Join数据优化操作场景使用Join语句时，如果数据量大，可能造成命令执行速度和查询速度慢，此时可进行Join优化。 Join优化可分为以下方式： Map Join Sort Merge Bucket Map Join Join顺序优化 Map Join Hive的Map

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
BE运行数据导入或查询任务报错 - MapReduce服务 MRS

BE运行数据导入或查询任务报错现象描述导入或查询数据时，报错： Not connected to 192.168.100.1:8060 yet, server_id=384 原因分析运行任务的BE节点故障。 RPC拥塞或其他错误。处理步骤如果运行任务的BE节点故障，需查看具体的故障原因再进行解决。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题
ALM-13006 Znode数量或容量超过阈值 - MapReduce服务 MRS

ALM-13006 Znode数量或容量超过阈值告警解释系统每4小时周期性检测ZooKeeper服务数据目录下二级znode状态，当检测到二级Znode数量或者容量超过阈值时产生该告警。告警属性告警ID 告警级别是否自动清除 13006 次要是告警参数参数名称参数含义

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink任务开发规则 - MapReduce服务 MRS

Flink任务开发规则对有更新操作的数据流进行聚合计算时要注意数据准确性问题在针对更新数据进行聚合需要选择合适的解决方案，否则聚合结果会是错误的。例如： Create table t1( id int, partid int, value int );

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink任务开发规范
FlinkSQL HBase数据表开发建议 - MapReduce服务 MRS

FlinkSQL HBase数据表开发建议客户端提交作业时通过with属性添加HBase配置信息 Flink客户端提交作业，如SQL client提交，在建表语句中添加如下配置：表1 Flink作业with属性配置说明 'properties.hbase.rpc.protection'

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > FlinkSQL Connector开发规范
Hudi表初始化 - MapReduce服务 MRS
Hudi表初始化 - MapReduce服务 MRS

Hudi表初始化初始化导入存量数据通常由Spark作业来完成，由于初始化数据量通常较大，因此推荐使用API方式给充足资源来完成。对于批量初始化后需要接Flink或Spark流作业实时写入的场景，一般建议通过对上有消息进行过滤，从一个指定的时间范围开始消费来控制数据的重复接入量

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
ALM-45587 IoTDBServer垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-45587 IoTDBServer垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测IoTDBServer进程的垃圾回收（GC）时间，当检测到IoTDBServer进程的垃圾回收（GC）连续3次超过阈值（默认12秒）时产生该告警。用户可通过“运维 > 告警 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45590 ConfigNode垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-45590 ConfigNode垃圾回收（GC）时间超过阈值告警解释系统每60秒周期性检测ConfigNode进程的垃圾回收（GC）时间，当检测到ConfigNode进程的垃圾回收（GC）时间连续3次超过阈值（默认12秒）时产生该告警。当ConfigNode垃圾回收（GC）时间小于阈值时，告警清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Spark Core广播变量 - MapReduce服务 MRS

配置Spark Core广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
ALM-45586 IoTDBServer堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-45586 IoTDBServer堆内存使用率超过阈值告警解释系统每60秒周期性检测IoTDBServer进程堆内存使用状态，当检测到IoTDBServer进程堆内存使用率超出阈值（最大内存的90%）时产生该告警。告警属性告警ID 告警级别是否自动清除 45586

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化操作场景 Spark SQL中，当对两个表进行join操作时，利用Broadcast特性（请参见使用广播变量），将小表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败问题使用Hash shuffle运行1000000（map个数）*100000（reduce个数）的任务，运行日志中出现大量的消息发送失败和Executor心跳超时，从而导致任务失败。回答对于Hash shuffle，在shuffl

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
ALM-45589 ConfigNode堆内存使用率超过阈值 - MapReduce服务 MRS

ALM-45589 ConfigNode堆内存使用率超过阈值告警解释系统每60秒周期性检测ConfigNode进程堆内存使用状态，当检测到ConfigNode进程堆内存使用率超出阈值（最大内存的90%）时产生该告警。当ConfigNode进程堆内存使用率小于阈值时，告警清除。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ClickHouse加速TTL操作调优 - MapReduce服务 MRS

ClickHouse加速TTL操作调优 ClickHouse触发TTL的时候，对CPU和内存会存在较大消耗和占用。登录FusionInsight Manager界面，选择“集群 > ClickHouse > 配置 > 全部配置 > ClickHouseServer > 自定义 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse性能调优
使用广播变量 - MapReduce服务 MRS

使用广播变量操作场景 Broadcast（广播）可以把数据集合分发到每一个节点上，Spark任务在执行过程中要使用这个数据集合时，就会在本地查找Broadcast过来的数据集合。如果不使用Broadcast，每次任务需要数据集合时，都会把数据序列化到任务里面，不但耗时，还使任务变得很大。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
ALM-50232 Doris中存在较大的Tablet - MapReduce服务 MRS

ALM-50232 Doris中存在较大的Tablet 告警解释告警模块按5分钟周期检查Doris集群中是否存在大于3GB（可通过“alarm_tablet_max_size”参数修改该值）的Tablet，如果存在则产生此告警。当检测到Doris集群中不存在大于3GB的Tablet时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 HBase简介 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
使用Stream Load时报RPC超时错误 - MapReduce服务 MRS

使用Stream Load时报RPC超时错误问题现象导入数据时BE打开tablet writer的RPC超时，报错： failed to open tablet writer, error=RPC call is timeout, error_text=[E1008] Reached

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见问题

总条数： 695

上一页
1
...
24
25
26
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

合并CarbonData表Segments - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

BE运行数据导入或查询任务报错 - MapReduce服务 MRS

ALM-13006 Znode数量或容量超过阈值 - MapReduce服务 MRS

Flink任务开发规则 - MapReduce服务 MRS

FlinkSQL HBase数据表开发建议 - MapReduce服务 MRS

Hudi表初始化 - MapReduce服务 MRS

ALM-45587 IoTDBServer垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

ALM-45590 ConfigNode垃圾回收（GC）时间超过阈值 - MapReduce服务 MRS

配置Spark Core广播变量 - MapReduce服务 MRS

ALM-45586 IoTDBServer堆内存使用率超过阈值 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

使用Hash shuffle出现任务失败 - MapReduce服务 MRS

ALM-45589 ConfigNode堆内存使用率超过阈值 - MapReduce服务 MRS

ClickHouse加速TTL操作调优 - MapReduce服务 MRS

使用广播变量 - MapReduce服务 MRS

ALM-50232 Doris中存在较大的Tablet - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

使用Stream Load时报RPC超时错误 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线