搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群操作场景本入门提供从零开始创建ClickHouse集群并通过集群客户端进行ClickHouse表的创建与查询操作指导。 ClickHouse是一款开源的面向联机分析处理的列式数据库，独立于Hadoop大数据体系，具有压缩率和极速查询性能。

帮助中心 > MapReduce服务 MRS > 快速入门
添加MRS子租户 - MapReduce服务 MRS

群名称，进入集群信息页面。在集群详情页，单击“租户管理”。在左侧租户列表，将光标移动到需要添加子租户的租户节点上，单击“添加子租户”，打开添加子租户的配置页面，参见以下表格内容为租户配置属性。表1 租户参数一览表（MRS 3.x版本）参数名示例描述名称 ta1 指定

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
HDFS应用开发规则 - MapReduce服务 MRS

HDFS文件操作API概述 Hadoop中关于文件操作类基本上全部是在“org.apache.hadoop.fs”包中，这些API能够支持的操作包含：打开文件，读写文件，删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem，该类是个抽象类，只能通过来类的get方法得到

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase 操作场景该任务指导用户使用Flume客户端从本地采集静态日志保存到HBase表：flume_test。该场景介绍的是多级agent串联操作。本章节适用于MRS 3.x及之后版本。本配置默认集群网络环境是安全的，数据传

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase 该任务指导用户使用Flume客户端从本地采集静态日志保存到HBase表：flume_test。该场景介绍的是多级agent串联操作。本配置默认集群网络环境是安全的，数据传输过程不需要启用SSL认证。如需使用加密方式，请参

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
创建FlinkServer作业对接DWS表 - MapReduce服务 MRS

创建FlinkServer作业对接DWS表操作场景 FlinkServer支持对接8.1.x及之后版本的GaussDB（DWS）数据库，本章节介绍GaussDB（DWS）作为Source表、Sink表以及维表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在F

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
快速开发ClickHouse应用 - MapReduce服务 MRS

快速开发ClickHouse应用 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。 ClickHouse的设计优点：数据压缩比高多核并行计算向量化计算引擎支持嵌套数据结构

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明表1 补丁基本信息补丁号 MRS 3.2.0-LTS.1.10 发布时间 2024-10-30 解决的问题解决Flume后台卸载客户端后，从Flume管理的页面上无法删除该客户端实例的问题。解决Kafka时延监控转告警（Topic数量监控、分区数量监控、请求时延监控）的问题。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.2.0-LTS.1.10补丁说明
补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明表1 补丁基本信息补丁号 MRS_3.3.0-LTS.1.1 发布时间 2024-12-20 解决的问题解决Manager问题: 修改Chrony的域名会导致Nodeagent无法启动。集群扩容时，在同步组件配置时HDFS组件配置同步失败，导致启动HDFS服务失败。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.0-LTS.1.1补丁说明
为什么主NameNode重启后系统出现双备现象 - MapReduce服务 MRS

为什么主NameNode重启后系统出现双备现象问题为什么主NameNode重启后系统出现双备现象？出现该问题时，查看ZooKeeper和ZKFC的日志，发现ZooKeeper服务端与客户端（ZKFC）通信时所使用的session不一致，ZooKeeper服务端的sessio

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS常见问题
创建FlinkServer作业写入数据至HDFS文件系统 - MapReduce服务 MRS

分区文件达到该阈值后，进行滚动。 sink.rolling-policy.rollover-interval 30min Duration 分区文件在滚动前可以保持打开的最长持续时间。 sink.rolling-policy.check-interval 1min Duration 检查基于时间的滚动策略的时间间隔。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
为什么主NameNode重启后系统出现双备现象 - MapReduce服务 MRS

为什么主NameNode重启后系统出现双备现象问题为什么主NameNode重启后系统出现双备现象？出现该问题时，查看ZooKeeper和ZKFC的日志，发现ZooKeeper服务端与客户端（ZKFC）通信时所使用的session不一致，ZooKeeper服务端的sessio

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS常见问题
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

Spark基本原理 Spark简介 Spark是一个开源的，并行数据处理框架，能够帮助用户简单、快速的开发大数据应用，对数据进行离线处理、流式处理、交互式分析等。 Spark提供了一个快速的计算、写入及交互式查询的框架。相比于Hadoop，Spark拥有明显的性能优势。Spark

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
添加MRS集群Task节点弹性伸缩策略 - MapReduce服务 MRS

登录MRS管理控制台。在购买包含有Task类型节点组件的集群时，参考自定义购买MRS集群配置集群软件配置和硬件配置信息后，在“高级配置”页签的弹性伸缩栏，打开对应Task节点类型后的开关按钮，即可进行弹性伸缩规则及资源计划的配置或修改。图1 创建集群时配置弹性伸缩您可以参考以下场景进行配置：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整 > MRS集群Task节点弹性伸缩
如何配置HBase双读功能 - MapReduce服务 MRS

如何配置HBase双读功能操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于四个查询场景：使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发常见问题
Spark2x基本原理 - MapReduce服务 MRS

Spark2x基本原理 Spark2x组件适用于MRS 3.x及后续版本。简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
如何配置HBase双读能力 - MapReduce服务 MRS

如何配置HBase双读能力操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于四个查询场景：使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发常见问题

总条数： 824

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

添加MRS子租户 - MapReduce服务 MRS

HDFS应用开发规则 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

创建FlinkServer作业对接DWS表 - MapReduce服务 MRS

快速开发ClickHouse应用 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

为什么主NameNode重启后系统出现双备现象 - MapReduce服务 MRS

创建FlinkServer作业写入数据至HDFS文件系统 - MapReduce服务 MRS

为什么主NameNode重启后系统出现双备现象 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

添加MRS集群Task节点弹性伸缩策略 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

如何配置HBase双读能力 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线