搜索_华为云

配置源数据心跳表实现数据判齐功能 - MapReduce服务 MRS

心跳和数据判齐功能用于统计CDL同步任务的全链路信息，包括从数据库管理系统RDBMS到Kafka的数据耗时、从Kafka消费数据写入到Hudi的数据耗时和数据条数等一系列信息，并将其写入到特定的Topic（cdl_snapshot_topic）中，用户可自行消费Topic中的数据并写入到某个特定H

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业前准备
ALM-12172 指标上报CES失败 - MapReduce服务 MRS

集群开启指标共享后，controller周期性的收集集群指标信息并上报到CES。告警属性告警ID 告警级别是否自动清除 12172 重要是告警参数参数名称参数含义来源产生告警的集群或者系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响监控指

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
导入并配置Spark样例工程 - MapReduce服务 MRS

针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*.py）即可。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

针对Java和Scala不同语言的工程，其导入方式相同。使用Python开发的样例工程不需要导入，直接打开Python文件（*.py）即可。以下操作步骤以导入Java样例代码为例。操作流程如图1所示。图1 导入样例工程流程前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
MapReduce统计样例代码 - MapReduce服务 MRS

reduce输出为key：网民的信息，value：该网民上网总时间。 context.write(key, result); } /** * setup()方法只在进入map任务的map()方法之前或者reduce任务的reduce()方法之前调用一次。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce统计样例程序
创建Bucket索引表调优 - MapReduce服务 MRS

方法三：数据老化，按照业务逻辑分析大的维度表是否可以通过数据老化清理无效的维度数据从而降低数据规模。数据量非常小的事实表这种可以在预估很长一段时间的数据增长量的前提下使用非分区表预留稍宽裕一些的桶数来提升读写性能。确认表内桶数 Hudi表的桶数设置，关系到表的性能，需要格外引起注意。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
ALM-47003 MemArtsCC Worker进程内存使用超过阈值 - MapReduce服务 MRS

产生告警的集群或系统名称服务名产生告警的服务名称角色名产生告警的角色名称主机名产生告警的主机名对系统的影响单个CCWorker进程的内存使用超过最大限制内存后可能会出现进程重启，短暂影响缓存命中率。可能原因上层计算服务（Spark/Hive/HetuEngine等）对MemArts

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
访问Spark WebUI界面 - MapReduce服务 MRS

Spark Web UI 在Spark WebUI页面，用于展示已经完成的和未完成的Spark应用的运行情况。页面包括了应用ID、应用名称、开始时间、执行时间、所属用户等信息。父主题：使用Spark/Spark2x

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
ALM-14027 DataNode磁盘故障 - MapReduce服务 MRS

服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。 Failed Volumes 故障的磁盘列表。对系统的影响上报DataNode磁盘故障告警时，表示该DataNode节点上存在故障的磁盘分区，可能会导致已写入的文件丢失。可能原因硬盘故障。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12017 磁盘容量不足（2.x及以前版本） - MapReduce服务 MRS

判断是否为系统盘。打开MRS集群详情页面，在告警管理页签的告警列表中，单击此告警所在行，在告警详情中，查看该告警的主机名称和磁盘分区信息。登录告警节点。执行df -h命令，查看系统磁盘分区的使用信息。并通过2.a中获取到的磁盘分区名称，查看该磁盘是否挂载在如下几个目录下：“/”、“/b

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

参数含义来源产生告警的集群名称。服务名产生告警的服务名称。应用名产生告警的应用名称。角色名产生告警的角色名称。任务名产生告警的作业名称。对系统的影响 Flink作业RocksDB持续触发写限流，主要反应的是Flink作业的CheckPoint的性能，对Flinkserver本身没有影响。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark SQL性能调优 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化合并CBO优化多级嵌套子查询以及混合Join的SQL调优父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
提交作业失败，报错与OBS相关如何处理？ - MapReduce服务 MRS

Web UI”，查找实际作业编号对应的Logs。查看实际作业日志中是否有如下报错。如果有下述报错，则需要给集群绑定OBS委托后再进行重试提交。具体请参考为已有集群绑定OBS委托。查看Launcher作业对应的日志。作业管理中单击查看日志，查看Launcher作业中的stdout或

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
MRS集群默认权限信息说明 - MapReduce服务 MRS

Kafka的Topic读写用户组。添加入本组的用户，拥有所有Topic的读写权限。 cdladmin CDL的管理员用户组，只有此组中的用户才可以访问CDL的API。 cdl CDL的普通用户组，属于该组的用户可以执行CDL的创建和查询操作。 storm Storm的普通用户组，

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 集群用户权限概述
ALM-23005 Loader非堆内存使用率超过阈值 - MapReduce服务 MRS

查该告警的“定位信息”。查看告警上报的实例主机名。在FusionInsight Manager首页，选择“集群 > 待操作集群的名称 > 服务 > Loader > 实例”，选择上报告警实例主机名对应的角色，单击图表区域右上角的下拉菜单，选择“定制”，勾选“内存”中的“Loader非堆内存使用率”，单击“确定”。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark client CLI介绍 - MapReduce服务 MRS

CLI详细的使用方法参考官方网站的描述：http://archive.apache.org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置Spark动态脱敏 - MapReduce服务 MRS

Spark动态脱敏开启后，配置脱敏列的数据可以参与计算，计算结果输出时不可见，在集群内脱敏策略会根据血缘关系自动传递，更大的发挥数据的价值同时，保障数据的隐私性。使用约束不支持Hudi表的脱敏。不支持非SQL使用方法的脱敏。不支持涉及直接读写HDFS的操作的脱敏。不支持复杂类型array、map、struct的脱敏。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
如何处理HetuEngine SQL运行过程中报错Encountered too many errors - MapReduce服务 MRS

例”页签。增大计算实例中单个Worker的内存大小增大单个计算实例配置中的“Worker容器资源配置”的“容器内存（MB）”和“JVM”的“-Xmx”的值。控制单个查询在单个Worker的内存使用大小在“自定义配置”中单击“增加”，添加2个同名参数“query.max-m

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见问题
ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

告警级别是否自动清除 45275 紧急是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响当Ranger服务不可用时，Ranger无法正常工作，Ranger原生UI无法访问。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

fkaUI的页面。单击“Alarms”，查看已配置的积压告警的阈值信息是否合理。是，执行6。否，请在该页面重新配置积压告警的阈值信息并保存，执行5。等待5分钟，查看当前告警是否清除。是，操作结束。否，执行6。检查是否Topic流量激增。在KafkaUI的页面，单击“

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考

总条数： 4897

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置源数据心跳表实现数据判齐功能 - MapReduce服务 MRS

ALM-12172 指标上报CES失败 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

MapReduce统计样例代码 - MapReduce服务 MRS

创建Bucket索引表调优 - MapReduce服务 MRS

ALM-47003 MemArtsCC Worker进程内存使用超过阈值 - MapReduce服务 MRS

访问Spark WebUI界面 - MapReduce服务 MRS

ALM-14027 DataNode磁盘故障 - MapReduce服务 MRS

ALM-12017 磁盘容量不足（2.x及以前版本） - MapReduce服务 MRS

ALM-45642 RocksDB持续触发写限流 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

提交作业失败，报错与OBS相关如何处理？ - MapReduce服务 MRS

MRS集群默认权限信息说明 - MapReduce服务 MRS

ALM-23005 Loader非堆内存使用率超过阈值 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

配置Spark动态脱敏 - MapReduce服务 MRS

如何处理HetuEngine SQL运行过程中报错Encountered too many errors - MapReduce服务 MRS

ALM-45275 Ranger服务不可用 - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线