搜索_华为云

快速开发Spark应用 - MapReduce服务 MRS

Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：支持迭代计算，有效应对多步的数据处理逻辑。数据挖掘（Data

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Hive常用配置参数 - MapReduce服务 MRS

Hive常用配置参数 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。本章节主要介绍Hive常用参数。操作步骤登录FusionInsight Manager，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

使用MRS集群仅作数据计算处理的存算分离场景。用户通过IAM服务的“委托”机制进行简单配置，即可实现OBS的访问。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC基本原理 MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

luxio位于计算和存储之间，为包括Apache Spark、Presto、Mapreduce和Apache Hive的计算框架提供了数据抽象层，使上层的计算应用可以通过统一的客户端API和全局命名空间访问包括HDFS和OBS在内的持久化存储系统，从而实现了对计算和存储的分离。图1

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Spark2x与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(Dr

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
计费项 - MapReduce服务 MRS
计费项 - MapReduce服务 MRS

不相同，具体计费请以MRS价格计算器中的价格为准。弹性云服务器计费因子：vCPU和内存，不同规格的实例类型提供不同的计算和存储能力。包年/包月、按需计费节点个数 * 弹性云服务器单价 * 购买时长弹性云服务器单价请以弹性云服务器价格计算器中的价格为准。云硬盘（系统盘和数据盘）

帮助中心 > MapReduce服务 MRS > 计费说明
创建Task节点 - MapReduce服务 MRS
创建Task节点 - MapReduce服务 MRS

特性简介 MRS集群支持创建Task节点，只作为计算节点，不存放持久化的数据，是实现弹性伸缩的基础。客户价值在MRS服务只作为计算资源的场景下，使用Task节点可以节省成本，并可以更加方便快捷地对集群节点进行扩缩容，满足用户对集群计算能力随时增减的需求。用户场景当集群数据量变

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
HetuEngine物化视图概述 - MapReduce服务 MRS

将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。物化视图通常基于对数据表进行聚合和连接的查询结果创建。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
MemArtsCC与其他组件的关系 - MapReduce服务 MRS

emArtsCCInputStream，该InputStream从部署在计算侧上的MemArtsCC集群读取数据，从而减少OBS服务端压力，提升数据读取性能的目标。 MemArtsCC会将数据持久化存储到计算侧的存储中（SSD），OBS对接MemArtsCC有如下使用场景：提升存算分离架构访问数据的性能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
MRS集群类型介绍 - MapReduce服务 MRS

Hadoop集群完全使用开源Hadoop生态，采用YARN管理集群资源，提供Hive、Spark离线大规模分布式数据存储和计算，SparkStreaming、Flink流式数据计算、Tez有向无环图的分布式计算框架等Hadoop生态圈的组件，进行海量数据分析与查询。 Hadoop、Hive、Spark、T

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > 业务选型
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

针对传统存算一体大数据架构中扩容困难、资源利用率低等问题，MRS采用计算存储分离架构，存储基于公有云对象存储实现11个9的高可靠，无限容量，支撑企业数据量持续增长；计算资源支持0~N弹性扩缩，百节点快速发放。存算分离后，计算节点可实现真正的极致弹性伸缩；数据存储部分基于OBS的跨AZ等

 帮助中心 > MapReduce服务 MRS > 产品介绍
配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

、自动诊断服务，开启物化视图推荐能力后，系统能自动学习并推荐对业务最有价值的物化视图SQL，使HetuEngine具备自动预计算加速能力，在相关场景下在线查询效率获得倍数提升，同时有效降低系统负载压力。前提条件集群运行正常并至少安装一个QAS实例。已创建用于访问HetuEngine

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
配置内存 - MapReduce服务 MRS
配置内存 - MapReduce服务 MRS

配置内存操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL OUTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN

总条数： 1477

上一页
1
2
3
4
5
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

快速开发Spark应用 - MapReduce服务 MRS

Hive常用配置参数 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

Spark2x与其他组件的关系 - MapReduce服务 MRS

计费项 - MapReduce服务 MRS

创建Task节点 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 - MapReduce服务 MRS

MRS集群类型介绍 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

配置HetuEngine物化视图推荐能力 - MapReduce服务 MRS

配置内存 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线