搜索_华为云

快速开发Spark应用 - MapReduce服务 MRS

快速开发Spark应用 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
使用Loader导入数据 - MapReduce服务 MRS

使用Loader导入数据操作场景该任务指导用户完成将数据从外部的数据源导入到MRS的工作。一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。前提条件创建或

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

Spark基本原理 Spark简介 Spark是一个开源的，并行数据处理框架，能够帮助用户简单、快速的开发大数据应用，对数据进行离线处理、流式处理、交互式分析等。 Spark提供了一个快速的计算、写入及交互式查询的框架。相比于Hadoop，Spark拥有明显的性能优势。Spark

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
使用Loader导入数据至MRS集群 - MapReduce服务 MRS

使用Loader导入数据至MRS集群操作场景该任务指导用户完成将数据从外部的数据源导入到MRS的工作。一般情况下，用户可以手工在Loader界面管理数据导入导出作业。当用户需要通过shell脚本来更新与运行Loader作业时，必须对已安装的Loader客户端进行配置。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
Flink SQL逻辑开发建议 - MapReduce服务 MRS

Flink SQL逻辑开发建议在aggregate和join等操作前将数据过滤来减少计算的数据量提前过滤可以减少在shuffle阶段前的数据量，减少网络IO，从而提升查询效率。比如在表join前先过滤数据比在ON和WHERE时过滤可以有效较少join数据量。因为执行顺序从发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
更新客户端（3.x之前版本） - MapReduce服务 MRS

更新客户端（3.x之前版本）本章节适用于MRS 3.x之前版本的集群。MRS 3.x及之后版本，请参考更新客户端（3.x及之后版本）。更新客户端配置文件操作场景 MRS集群提供了客户端，可以在连接服务端、查看任务结果或管理数据的场景中使用。用户使用MRS的客户端时，如果在MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
准备连接Hive集群配置文件 - MapReduce服务 MRS

准备连接Hive集群配置文件准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户用于程序认证。以下Hive权限配置示例供参考，在实际业务场景中可根据业务需求灵活调整。登录FusionInsight Manager。选择“集群

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境
ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

ALM-12033 慢盘故障（2.x及以前版本）告警解释 MRS 2.x及以前版本：对于HDD盘，满足以下任意条件时触发告警：系统每3秒执行一次iostat命令，在30秒内连续10周期svctm值超过1000ms。系统每3秒执行一次iostat命令，在300秒内有超过60%的IO超过150ms。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
提升HBase实时写数据效率 - MapReduce服务 MRS

提升HBase实时写数据效率操作场景需要把数据实时写入到HBase中或者对于大批量、连续put的场景。本章节适用于MRS 3.x及之后版本。前提条件调用HBase的put或delete接口，把数据保存到HBase中。操作步骤写数据服务端调优参数入口：登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
提升HBase实时写数据效率 - MapReduce服务 MRS

提升HBase实时写数据效率操作场景需要把数据实时写入到HBase中或者对于大批量、连续Put的场景。前提条件调用HBase的put或delete接口，把数据保存到HBase中。操作步骤写数据服务端调优参数入口：登录FusionInsight Manager，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
使用ZooKeeper客户端 - MapReduce服务 MRS

使用ZooKeeper客户端 Zookeeper是一个开源的，高可靠的，分布式一致性协调服务。Zookeeper设计目标是用来解决那些复杂，易出错的分布式系统难以保证数据一致性的。不必开发专门的协同应用，十分适合高可用服务保持数据一致性。背景信息在使用客户端前，除主管理节点以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
CDL数据集成概述 - MapReduce服务 MRS

CDL数据集成概述 CDL是一种简单、高效的数据实时集成服务，能够从各种OLTP数据库中抓取Data Change事件，然后推送至Kafka中，最后由Sink Connector消费Topic中的数据并导入到大数据生态软件应用中，从而实现数据的实时入湖。 CDL服务包含了两个重要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
配置Doris冷热分离 - MapReduce服务 MRS

配置Doris冷热分离该章节主要介绍如何配置和使用Doris冷热分离功能。前提条件 Doris集群与OBS网络互通，相关操作具体请参考初始化配置。创建OBS并行文件系统并获取AK/SK和DomainID 创建OBS并行文件系统。登录OBS管理控制台。选择“并行文件系统 >

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > Doris冷热分离
配置MRS集群用户的OBS的细粒度访问权限 - MapReduce服务 MRS

配置MRS集群用户的OBS的细粒度访问权限开启细粒度权限时，用户通过该指导配置访问OBS权限，实现MRS用户对OBS文件系统下的目录权限控制。该章节内容不适用于MRS 1.9.2版本。如需对MRS的用户访问OBS的资源进行详细控制，可通过该功能实现。例如，您只允许用户组A访

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
安装客户端（3.x之前版本） - MapReduce服务 MRS

安装客户端（3.x之前版本）操作场景用户需要使用MRS客户端。MRS集群客户端可以安装在集群内的Master节点或者Core节点，也可以安装在集群外节点上。 MRS 3.x之前版本集群在集群创建后，在主Master节点默认安装有客户端，可以直接使用，安装目录为“/opt/client”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
快速使用Hive进行数据分析 - MapReduce服务 MRS

快速使用Hive进行数据分析 Hive是基于Hadoop的一个数据仓库工具，可将结构化的数据文件映射成一张数据库表，并提供类SQL的功能对数据进行分析处理，通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。背景信息

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
安装补丁 - MapReduce服务 MRS
安装补丁 - MapReduce服务 MRS

安装补丁安装补丁登录MRS管理控制台。选择“现有集群”，选中需要安装补丁的集群并单击集群名，进入集群基本信息页面。进入“补丁管理”页面，在操作列表中单击“安装”。进入“警告”页面，阅读补丁说明，并单击“确定”。图1 安装补丁请确保集群允许root登录，并且所有节点的root密码一致。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.0-LTS.1.1补丁说明
IoTDB UDF概述 - MapReduce服务 MRS
IoTDB UDF概述 - MapReduce服务 MRS

IoTDB UDF概述 UDF（User Defined Function）即用户自定义函数。IoTDB提供多种内建函数及自定义函数来满足用户的计算需求。 UDF类型 IoTDB支持的UDF函数的类型如表1所示。表1 UDF函数类型 UDF分类描述 UDTF（User Defined

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用IoTDB > 创建IoTDB用户自定义函数（UDF）
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明

总条数： 517

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

快速开发Spark应用 - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

使用Loader导入数据至MRS集群 - MapReduce服务 MRS

Flink SQL逻辑开发建议 - MapReduce服务 MRS

更新客户端（3.x之前版本） - MapReduce服务 MRS

准备连接Hive集群配置文件 - MapReduce服务 MRS

ALM-12033 慢盘故障（2.x及以前版本） - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

使用ZooKeeper客户端 - MapReduce服务 MRS

CDL数据集成概述 - MapReduce服务 MRS

配置Doris冷热分离 - MapReduce服务 MRS

配置MRS集群用户的OBS的细粒度访问权限 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

安装客户端（3.x之前版本） - MapReduce服务 MRS

快速使用Hive进行数据分析 - MapReduce服务 MRS

安装补丁 - MapReduce服务 MRS

IoTDB UDF概述 - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线