搜索_华为云

Spark2x基本原理 - MapReduce服务 MRS

简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能够快速地从MapReduce切换到Spark计算平台上去。Spark提供一站式数

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
集群生命周期管理 - MapReduce服务 MRS

高，以支持更大集群的管理。 Core节点：支持存储和计算两种目标的节点，可扩容、缩容。因承载数据存储功能，因此在缩容时，为保证数据不丢失，有较多限制，无法进行弹性伸缩。 Task节点：仅用于计算的节点，可扩容、缩容。因只承载计算任务，因此可以进行弹性伸缩。 MRS购买集群方式支持自定义购买集群和快速购买集群两种。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
Manager样例程序开发思路 - MapReduce服务 MRS

Manager样例程序开发思路通过典型场景，可以快速学习和掌握Manage REST API的开发过程，并且对关键的函数有所了解。场景说明假定用户需要以非界面方式实现操作FusionInsight Manager系统，要求开发基于HTTP Basic认证的应用程序实现如下功能：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Manager管理开发指南 > 开发Manager应用
HetuEngine物化视图概述 - MapReduce服务 MRS

将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。物化视图通常基于对数据表进行聚合和连接的查询结果创建。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
购买专属云MRS集群 - MapReduce服务 MRS

集群。如果您希望MRS服务运行在隔离的专属区域，请您先申请专属计算集群，再创建专属云MRS集群。了解和申请专属计算集群，请参见《专属计算集群用户指南》。如果您希望MRS服务拥有独享的存储设备，请您在开通专属计算集群后申请专属企业存储，再创建专属云MRS集群。了解和申请专属

 帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
Alluxio - MapReduce服务 MRS
Alluxio - MapReduce服务 MRS

luxio位于计算和存储之间，为包括Apache Spark、Presto、Mapreduce和Apache Hive的计算框架提供了数据抽象层，使上层的计算应用可以通过统一的客户端API和全局命名空间访问包括HDFS和OBS在内的持久化存储系统，从而实现了对计算和存储的分离。图1

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
通过Flink作业处理OBS数据 - MapReduce服务 MRS

MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅做数据计算处理的存算分离模式。本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。方案架构 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark 应用场景在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用Pyspark。方案架构 S

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
HDFS显示磁盘空间不足，其实还有10%磁盘空间 - MapReduce服务 MRS

percentage参数：每个磁盘的保留空间所占磁盘百分比。DataNode会保留这么多可用空间，以备其他组件如Yarn的NodeManager运行计算时，或者预留升级时使用。因为预留了10%的磁盘，当磁盘使用率达到90%的时候，HDFS的DataNode即会认为没有可用磁盘空间。解决办法

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
HBase样例程序开发思路 - MapReduce服务 MRS

HBase样例程序开发思路通过典型场景，您可以快速学习和掌握HBase的开发过程，并且对关键的接口函数有所了解。场景说明假定用户开发一个应用程序，用于管理企业中的使用A业务的用户信息，如表1所示，A业务操作流程如下：创建用户信息表。在用户信息中新增用户的学历、职称等信息。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

当使用Flink的Full outer Join算子实现宽表拼接功能时，由于状态会被多次重复存储导致状态后端压力大，计算性能差。使用MultiJoin算子进行宽表拼接计算性能可以提升1倍。 FlinkSQL支持MultiJoin算子使用限制 MultiJoin算子只支持FULL OUTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
HetuEngine样例程序开发思路 - MapReduce服务 MRS

HetuEngine样例程序开发思路通过典型场景，用户可以快速学习和掌握HetuEngine的开发过程，并且对关键的接口函数有所了解。场景说明假定用户开发一个应用程序，需要对Hive数据源的A表和MPPDB数据源的B表进行join运算，则可以用HetuEngine来实现Hive数据源数据查询，流程如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 开发HetuEngine应用
Flink作业引擎概述 - MapReduce服务 MRS

流处理支持24小时窗口聚合计算，毫秒级性能。批处理支持90天窗口聚合计算，分钟级计算完成。支持对流处理和批处理的数据进行过滤配置，过滤无效数据。读取HDFS数据时，提前根据计算周期过滤。作业定义平台故障、服务降级，不支持再定义作业，但是不影响已有作业计算。作业故障有自动重启机制，重启策略可配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
HetuEngine样例程序开发思路 - MapReduce服务 MRS

HetuEngine样例程序开发思路通过典型场景，用户可以快速学习和掌握HetuEngine的开发过程，并且对关键的接口函数有所了解。场景说明假定用户开发一个应用程序，需要对Hive数据源的A表和MPPDB数据源的B表进行join运算，则可以用HetuEngine来实现Hive数据源数据查询，流程如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 开发HetuEngine应用
Spark client CLI介绍 - MapReduce服务 MRS

org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互式数据分析的工具。同时支持Scala和Python两种语言。在Spark目录下，执行./bin/spark-she

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark client CLI介绍 - MapReduce服务 MRS

org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互式数据分析的工具。同时支持Scala和Python两种语言。在Spark目录下，执行./bin/spark-she

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
MemArtsCC基本原理 - MapReduce服务 MRS

MemArtsCC基本原理 MemArtsCC是一款面向存算分离架构的分布式计算侧缓存系统，采用极轻量化的架构设计，部署在计算侧的集群中，通过智能预取远端对象存储上的数据提供高速缓存能力，从而来加速计算任务执行。 MemArtsCC在存储层面将远端对象存储(OBS)上的对象进行切

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MemArtsCC
Hive常用配置参数 - MapReduce服务 MRS

Hive常用配置参数 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。本章节主要介绍Hive常用参数。操作步骤登录FusionInsight Manager，选择“集群 > 服务 > Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
导入并配置HDFS样例工程 - MapReduce服务 MRS

导入并配置HDFS样例工程操作场景 HDFS针对多个场景提供样例工程，帮助客户快速学习HDFS工程。以下操作步骤以导入HDFS样例代码为例。操作流程如图1所示。图1 导入样例工程流程操作步骤参考获取MRS应用开发样例工程，获取样例代码解压目录中“src”目录下的样例工程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
Spark client CLI介绍 - MapReduce服务 MRS

org/dist/spark/docs/3.3.1/quick-start.html。常用CLI Spark常用的CLI如下所示： spark-shell 提供了一个简单学习API的方法，类似于交互式数据分析的工具。同时支持Scala和Python两种语言。在Spark目录下，执行./bin/spark-she

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍

总条数： 1242

上一页
1
2
3
4
5
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark2x基本原理 - MapReduce服务 MRS

集群生命周期管理 - MapReduce服务 MRS

Manager样例程序开发思路 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

购买专属云MRS集群 - MapReduce服务 MRS

Alluxio - MapReduce服务 MRS

通过Flink作业处理OBS数据 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

HDFS显示磁盘空间不足，其实还有10%磁盘空间 - MapReduce服务 MRS

HBase样例程序开发思路 - MapReduce服务 MRS

FlinkSQL支持MultiJoin算子 - MapReduce服务 MRS

HetuEngine样例程序开发思路 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

HetuEngine样例程序开发思路 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

MemArtsCC基本原理 - MapReduce服务 MRS

Hive常用配置参数 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

Spark client CLI介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线