搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
缩容MRS集群 - MapReduce服务 MRS
缩容MRS集群 - MapReduce服务 MRS

缩容MRS集群用户可以根据业务需求量，通过简单的缩减Core节点或者Task节点，对集群进行缩容，以使MRS拥有更优的存储、计算能力，降低运维成本。当集群正在进行主备同步操作时，不允许进行缩容操作。包周期集群不支持该方式缩容，仅按需计费集群支持该方式缩容。如需缩容包周期计费

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
快速开发Spark应用 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。数据挖掘（Data

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Hive常用配置参数 - MapReduce服务 MRS

Hive常用配置参数 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。本章节主要介绍Hive常用参数。操作步骤登录FusionInsight Manager，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

使用MRS集群仅作数据计算处理的存算分离场景。用户通过IAM服务的“委托”机制进行简单配置，即可实现OBS的访问。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
查看MRS作业详情和日志 - MapReduce服务 MRS

查看MRS作业详情和日志用户通过管理控制台可在线查看当前MRS集群内所有作业的状态详情，以及作业的详细配置信息和运行日志信息。由于Spark SQL和Distcp作业在后台无日志，因此运行中的Spark SQL和Distcp作业不能在线查看运行日志信息。查看作业状态登录MRS管理控制台。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC基本原理 MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

HetuEngine SQL诊断功能介绍 HetuEngine QAS实例可对用户的SQL执行历史记录提供自动感知、自动学习、自动诊断服务，提升在线SQL运维能力，自动加速在线SQL分析任务，开启SQL诊断能力后，系统可实现如下能力：自动感知并向集群管理员展现不同时间周期范围内的租户级、用户级的S

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

luxio位于计算和存储之间，为包括Apache Spark、Presto、Mapreduce和Apache Hive的计算框架提供了数据抽象层，使上层的计算应用可以通过统一的客户端API和全局命名空间访问包括HDFS和OBS在内的持久化存储系统，从而实现了对计算和存储的分离。图1

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Spark2x与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
创建Task节点 - MapReduce服务 MRS
创建Task节点 - MapReduce服务 MRS

特性简介 MRS集群支持创建Task节点，只作为计算节点，不存放持久化的数据，是实现弹性伸缩的基础。客户价值在MRS服务只作为计算资源的场景下，使用Task节点可以节省成本，并可以更加方便快捷地对集群节点进行扩缩容，满足用户对集群计算能力随时增减的需求。用户场景当集群数据量变

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
MemArtsCC与其他组件的关系 - MapReduce服务 MRS

emArtsCCInputStream，该InputStream从部署在计算侧上的MemArtsCC集群读取数据，从而减少OBS服务端压力，提升数据读取性能的目标。 MemArtsCC会将数据持久化存储到计算侧的存储中（SSD），OBS对接MemArtsCC有如下使用场景：提升存算分离架构访问数据的性能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
Storm应用开发简介 - MapReduce服务 MRS

简单特定的任务。Storm的目标是提供对大数据流的实时处理，可以可靠地处理无限的数据流。 Storm有很多适用的场景：实时分析、在线机器学习、持续计算和分布式ETL等，易扩展、支持容错，可确保数据得到处理，易于构建和操控。 Storm有如下几个特点：适用场景广泛易扩展，可伸缩性高

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发概述
配置内存 - MapReduce服务 MRS
配置内存 - MapReduce服务 MRS

配置内存操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡，而HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL OUTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
计费说明 - MapReduce服务 MRS
计费说明 - MapReduce服务 MRS

IaaS基础设施资源费用（弹性云服务器，云硬盘，弹性IP/带宽等） MRS服务管理费用详情，请参见产品价格详情。您可以通过MRS提供的价格计算器，选择您需要的集群节点规格，来快速计算出购买MRS集群的参考价格。 MRS集群删除或退订后不再产生费用。计费模式使用MRS的首要操作就是购买MRS集群，MRS当前支持包年包月和按需计费模式。

帮助中心 > MapReduce服务 MRS > 产品介绍

总条数： 2277

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

缩容MRS集群 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

Hive常用配置参数 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

查看MRS作业详情和日志 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

配置HetuEngine SQL诊断功能 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

Spark2x与其他组件的关系 - MapReduce服务 MRS

创建Task节点 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 - MapReduce服务 MRS

Storm应用开发简介 - MapReduce服务 MRS

配置内存 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

计费说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线