搜索_华为云

运行SparkSubmit作业 - MapReduce服务 MRS

如需添加多个参数，请单击右侧的“添加”按钮。例如作业需要通过AK/SK方式访问OBS，增加以下服务配置参数： fs.obs.access.key：访问OBS的密钥ID。 fs.obs.secret.key：访问OBS与密钥ID对应的密钥。 - 命令参考用于展示提交作业时提交到后台执行的命令。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
MRS支持什么类型的分布式存储？ - MapReduce服务 MRS

答： MRS集群内使用主流的大数据Hadoop，目前支持Hadoop 3.x版本，并且随集群演进更新版本。同时MRS也支持用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式。更多信息MRS各版本支持的组件情况请参见MRS组件版本一览表。父主题：产品咨询类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
ZooKeeper基本原理 - MapReduce服务 MRS

llower和Observer。 Follower Follower的功能有两个：每个Follower都作为Leader的储备，当Leader故障时重新选举Leader，避免单点故障。处理读请求，并配合Leader一起进行写请求处理。 Observer Observer不参与

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

令。一方面实现和Hive的解耦，另一方面可以对命令进行定制化。 DataSet DataSet是一个由特定域的对象组成的强类型集合，可通过功能或关系操作并行转换其中的对象。每个Dataset还有一个非类型视图，即由多个列组成的DataSet，称为DataFrame。 DataF

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
ALM-45452 ClickHouse本地磁盘剩余空间低于冷热分离策略配置阈值 - MapReduce服务 MRS

产生告警的集群或系统名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响导致本地磁盘的部分热数据会移动到OBS上，影响系统的读写性能。可能原因 ClickHouseServer节点冷热分离配置的本地磁盘容量过小。处理步骤登录FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Iceberg - MapReduce服务 MRS
Iceberg - MapReduce服务 MRS

Iceberg Iceberg原理介绍 Iceberg是一种开放的数据湖表格式，可以基于Iceberg快速地在HDFS或OBS上构建自己的数据湖存储服务。 Iceberg当前为公测阶段，若需使用需联系技术支持申请白名单开通。当前版本Iceberg仅支持Spark引擎，如需使用其他引擎构建数据湖服务，请使用Hudi。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
克隆MRS集群作业 - MapReduce服务 MRS

在原有参数后继续添加参数，逗号后需要有空格，否则作业可能执行失败。克隆的作业返回参数不含有fs.obs.access.key、fs.obs.secret.key，若需要fs.obs.access.key、fs.obs.secret.key，需在“服务配置参数”中添加。单击“确定”下发克隆作业。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群作业
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率操作场景批量加载功能采用了MapReduce jobs直接生成符合HBase内部数据格式的文件，然后把生成的StoreFiles文件加载到正在运行的集群。使用批量加载相比直接使用HBase的API会节约更多的CPU和网络资源。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

原因：创建UDF后，Spark服务端的JDBCServer未重启或者spark-sql未重新启动的场景，Spark所在线程的FunctionRegistry对象未保存新创建的UDF，那么删除UDF时就会出现错误。解决方法：重启Spark服务端的JDBCServer和spark-sql，再删除此类UDF。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

原因：创建UDF后，Spark服务端的JDBCServer未重启或者spark-sql未重新启动的场景，Spark所在线程的FunctionRegistry对象未保存新创建的UDF，那么删除UDF时就会出现错误。解决方法：重启Spark服务端的JDBCServer和spark-sql，再删除此类UDF。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
ALM-45450 ClickHouse获取临时委托凭据失败 - MapReduce服务 MRS

如果一直无法获取到新的临时委托凭据，会导致在当前使用的临时委托凭据过期后，系统无法访问OBS，对于配置冷热分离策略的表无法进行OBS冷数据读写等操作。可能原因 ClickHouse配置的OBS参数错误。 IAM服务异常。处理步骤检查冷热分离相关配置信息是否正确。如果不正确，

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
API版本选择建议 - MapReduce服务 MRS

API版本选择建议当前MRS服务对外API提供云服务自定义规范的API V1.1和V2两类接口，V2版本目前仅部分接口支持，主要用于提交作业和提交SQL语句。在接口功能相同的情况下，推荐您优先使用V2接口。 MRS所有版本均支持V1.1接口。针对MRS 1.X版本的集群，MRS

帮助中心 > MapReduce服务 MRS > API参考
管理MRS集群备份恢复任务 - MapReduce服务 MRS

周期：修改备份任务下次启动，与上一次运行的时间间隔，支持按“小时”或按“天”。目的端NameService名称：修改备集群的NameService名称。目的端NameNode IP地址：修改备集群NameNode业务平面IP地址，支持主节点或备节点。目的端路径：修改备集群保存备份数据的HDFS目录。不支持

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

解决带有注释的SQL语句作业执行失败问题大数据组件解决ClickHouse集群IAM用户同步失败问题解决集群内Flume客户端无法使用委托访问OBS问题解决YARN开源原生界面作业占用队列资源百分比不显示问题解决YARN开源原生界面查看作业日志时显示不全的问题解决Hive作业在HDFS上临时文件残留问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

Timeout或者SocketTimeout Exception异常。调优建议：将ZooKeeper实例个数调整为5个及以上，可以通过设置peerType=observer来增加observer的数目。通过控制单个任务并发的map数或减少每个节点下运行task的内存，降低节点负载。升级ZooKeeper数据磁盘，如SSD等。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
DistCP作业导入导出数据常见问题 - MapReduce服务 MRS

答：DistCP类型作业导入导出数据时不会对比数据的一致性，只是对数据进行复制，不会修改数据。问：DistCP类型作业在导出时，遇到OBS里已经存在的文件是如何处理的？答：DistCP类型作业在导出时，遇到OBS里已经存在的文件时会覆盖原始文件。父主题：作业管理类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

时会报错。原因分析当使用load导入数据到Hive表的时候，属于需要跨文件系统的情况（例如原数据在HDFS上，而Hive表数据存放在OBS上），并且文件长度大于阈值（默认32 MB），则会触发使用distcp的MapReduce任务来执行数据迁移操作。这个MapReduce任

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 - MapReduce服务 MRS

dir被设置为/tmp，因此默认使用系统/tmp目录。但存在一些特殊情况，如driver进程未正常退出，比如被kill -9命令结束进程，或者Java虚拟机直接崩溃等场景，导致driver的退出流程未正常执行，则可能导致该部分目录无法被正常清理，残留在系统中。当前只有yarn-client模

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
MRS 1.9.0.5补丁说明 - MapReduce服务 MRS

beeline不打印日志的问题解决Yarn页面上active node数目不对问题解决RM线程数过多导致RM页面打开慢问题支持OBS监控 OBS包升级解决hive-jdbc并发插入10条数据时部分数据未插入问题解决hive偶现报kryo反序列化失败问题解决Spark jobhistory内存泄漏问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 - MapReduce服务 MRS

dir被设置为/tmp，因此默认使用系统/tmp目录。但存在一些特殊情况，如driver进程未正常退出，比如被kill -9命令结束进程，或者Java虚拟机直接崩溃等场景，导致driver的退出流程未正常执行，则可能导致该部分目录无法被正常清理，残留在系统中。当前只有yarn-client模

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题

总条数： 2612

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

运行SparkSubmit作业 - MapReduce服务 MRS

MRS支持什么类型的分布式存储？ - MapReduce服务 MRS

ZooKeeper基本原理 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

ALM-45452 ClickHouse本地磁盘剩余空间低于冷热分离策略配置阈值 - MapReduce服务 MRS

Iceberg - MapReduce服务 MRS

克隆MRS集群作业 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

为什么不同服务之间互相删除UDF失败 - MapReduce服务 MRS

ALM-45450 ClickHouse获取临时委托凭据失败 - MapReduce服务 MRS

API版本选择建议 - MapReduce服务 MRS

管理MRS集群备份恢复任务 - MapReduce服务 MRS

MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

有210000个map和10000个reduce的HBase BulkLoad任务运行失败 - MapReduce服务 MRS

DistCP作业导入导出数据常见问题 - MapReduce服务 MRS

spark-shell执行SQL跨文件系统load数据到Hive表失败 - MapReduce服务 MRS

在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 - MapReduce服务 MRS

MRS 1.9.0.5补丁说明 - MapReduce服务 MRS

在客户端安装节点的/tmp目录下残留了很多blockmgr-开头和spark-开头的目录 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线