搜索_华为云

Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage失败重试次数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
更改DataNode的存储目录 - MapReduce服务 MRS

更改DataNode的存储目录操作场景本章节适用于MRS 3.x及后续版本。 HDFS DataNode定义的存储目录不正确或HDFS的存储规划变化时，MRS集群管理员需要在FusionInsight Manager中修改DataNode的存储目录，以保证HDFS正常工作。适用于以下场景：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
mapPartition接口使用 - MapReduce服务 MRS

mapPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用mapPartition接口并行遍历HBase表。数据规划使用foreachPartition接口使用章节创建的HBase数据表。开发思路构造

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkPut接口使用 - MapReduce服务 MRS

BulkPut接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将构建的RDD写入HBase中。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的Hase表： create

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列本章节适用于MRS 3.1.2及之后的版本。操作场景本章节介绍Kafka作为source表或者sink表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在FlinkServer作业管理页面操作。本示例以安全模式Kafka为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
Flink SQL逻辑开发建议 - MapReduce服务 MRS

Flink SQL逻辑开发建议在aggregate和join等操作前将数据过滤来减少计算的数据量提前过滤可以减少在shuffle阶段前的数据量，减少网络IO，从而提升查询效率。比如在表join前先过滤数据比在ON和WHERE时过滤可以有效较少join数据量。因为执行顺序从发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
错误码 - MapReduce服务 MRS
错误码 - MapReduce服务 MRS

错误码当您调用API时，如果遇到“APIGW”开头的错误码，请参见API网关错误码进行处理。状态码错误码错误信息描述处理措施 400 0023 Failed to obtain cluster details. 获取集群详情信息失败！请检查MRS集群状态、Maste

帮助中心 > MapReduce服务 MRS > API参考 > 附录
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

Geospatial函数以ST_前缀开头的HetuEngine Geospatial功能支持SQL、MM规范，并符合Open Geospatial Consortium（OGC）的OpenGIS规范。因此，许多HetuEngine Geospatial功能要求或更准确地说是假设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
MRS集群告警处理参考 - MapReduce服务 MRS

MRS集群告警处理参考 ALM-12001 审计日志转储失败 ALM-12004 OLdap资源异常 ALM-12005 OKerberos资源异常 ALM-12006 节点故障 ALM-12007 进程故障 ALM-12010 Manager主备节点间心跳中断 ALM-12011

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distr

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导本章节指导用户修复log4j2的CVE-2021-44228漏洞。目前有两种方式可以采用如下两种方式修复：现有集群节点安装补丁扩容节点安装补丁前提条件从OBS路径中下载的补丁工具“MRS_Log4j_Patch

帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

ClickHouse概述 ClickHouse表引擎介绍表引擎在ClickHouse中的作用十分关键，不同的表引擎决定了：数据存储和读取的位置支持哪些查询方式能否并发式访问数据能不能使用索引是否可以执行多线程请求数据复制使用的参数其中MergeTree和Distr

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
MRS 3.2.0-LTS.1补丁说明 - MapReduce服务 MRS

MRS 3.2.0-LTS.1补丁说明 MRS 3.2.0-LTS.1.7补丁基本信息表1 补丁基本信息补丁号 MRS 3.2.0-LTS.1.7 发布时间 2024-02-21 安装前处理如果MRS集群节点故障或者网络不通，需要先隔离该节点，否则补丁会安装失败。解决的问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist(

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范

总条数： 1000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark常用配置参数 - MapReduce服务 MRS

更改DataNode的存储目录 - MapReduce服务 MRS

mapPartition接口使用 - MapReduce服务 MRS

BulkPut接口使用 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

错误码 - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

MRS集群告警处理参考 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

MRS 3.2.0-LTS.1补丁说明 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线