搜索_华为云

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
Hive常用配置参数 - MapReduce服务 MRS

Hive常用配置参数 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。本章节主要介绍Hive常用参数。操作步骤登录FusionInsight Manager，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

步骤一：创建ECS委托步骤二：为MRS集群配置委托步骤三：创建OBS文件系统步骤四：Hive访问OBS文件系统步骤一：创建ECS委托登录华为云管理控制台。在服务列表中选择“管理与监管 > 统一身份认证服务”。选择“委托 > 创建委托”。设置“委托名称”。例如：mrs_ecs_obs。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC基本原理 MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
Spark与其他组件的关系 - MapReduce服务 MRS

Spark与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端(D

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
Spark2x与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 Spark和HDFS的关系通常，Spark中计算的数据可以来自多个数据源，如Local File、HDFS等。最常用的是HDFS，用户可以一次读取大规模的数据进行并行计算。在计算完成后，也可以将数据存储到HDFS。分解来看，Spark分成控制端

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
创建Task节点 - MapReduce服务 MRS
创建Task节点 - MapReduce服务 MRS

创建Task节点特性简介 MRS集群支持创建Task节点，只作为计算节点，不存放持久化的数据，是实现弹性伸缩的基础。客户价值在MRS服务只作为计算资源的场景下，使用Task节点可以节省成本，并可以更加方便快捷地对集群节点进行扩缩容，满足用户对集群计算能力随时增减的需求。用户场景

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
获取MRS应用开发样例工程 - MapReduce服务 MRS

获取MRS应用开发样例工程 MRS样例工程构建流程 MRS样例工程构建流程包括三个主要步骤：下载样例工程的Maven工程源码和配置文件，请参见获取MRS样例工程。配置华为镜像站中SDK的Maven镜像仓库，请参见配置华为开源镜像仓。根据用户自身需求，构建完整的Maven工程并进行编译开发。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x）
MemArtsCC与其他组件的关系 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 MemArtsCC与OBS的关系 OBS提供一种新的InputStream：OBSMemArtsCCInputStream，该InputStream从部署在计算侧上的MemArtsCC集群读取数据，从而减少OBS服务端压力，提升数据读取性能的目标。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
作业管理 - MapReduce服务 MRS
作业管理 - MapReduce服务 MRS

作业管理 MRS作业管理为用户提供向集群提交作业的入口，支持包括MapReduce、Spark、HQL和SparkSQL等类型的作业。结合华为云数据治理中心DataArts Studio，提供一站式的大数据协同开发环境、全托管的大数据调度能力，帮助用户快速构建大数据处理中心。通过数据治理中心DataArts

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
审计与日志 - MapReduce服务 MRS
审计与日志 - MapReduce服务 MRS

日志记录，通过云审计服务（Cloud Trace Service，CTS）实现。CTS是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建和配置追踪器后

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
配置内存 - MapReduce服务 MRS
配置内存 - MapReduce服务 MRS

配置内存操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-defaults

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子本章节适用于MRS 3.5.0及以后版本。当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 F

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink性能调优
Spark Core内存调优 - MapReduce服务 MRS

Spark Core内存调优操作场景 Spark是内存计算框架，计算过程中内存不够对Spark的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Yarn与其他组件的关系 - MapReduce服务 MRS

Yarn与其他组件的关系 Yarn和Spark组件的关系 Spark的计算调度方式，可以通过Yarn的模式实现。Spark共享Yarn集群提供丰富的计算资源，将任务分布式的运行起来。Spark on Yarn分两种模式：Yarn Cluster和Yarn Client。 Yarn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
优化Flink内存GC参数 - MapReduce服务 MRS

优化Flink内存GC参数操作场景 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink性能调优
Flink应用性能调优建议 - MapReduce服务 MRS

Flink应用性能调优建议配置内存 Flink是依赖内存计算，计算过程中内存不够对Flink的执行效率影响很大。可以通过监控GC（Garbage Collection），评估内存使用及剩余情况来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的YARN的Container

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发常见问题

总条数： 1895

上一页
1
2
3
4
5
...
95
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Hive常用配置参数 - MapReduce服务 MRS

使用MRS Hive表对接OBS文件系统 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

Spark与其他组件的关系 - MapReduce服务 MRS

Spark2x与其他组件的关系 - MapReduce服务 MRS

创建Task节点 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

MemArtsCC与其他组件的关系 - MapReduce服务 MRS

作业管理 - MapReduce服务 MRS

审计与日志 - MapReduce服务 MRS

配置内存 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

Yarn与其他组件的关系 - MapReduce服务 MRS

优化Flink内存GC参数 - MapReduce服务 MRS

Flink应用性能调优建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线