搜索_华为云

查询集群详情 - MapReduce服务 MRS

查询集群详情功能介绍查看指定集群的详细信息。该接口不兼容Sahara。接口约束无调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/cluster_infos/{cluster_id} 表1 路径参数参数是否必选参数类型描述 cluster_id

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
同步Kafka数据至ClickHouse - MapReduce服务 MRS

同步Kafka数据至ClickHouse 您可以通过创建Kafka引擎表将Kafka数据自动同步至ClickHouse集群，具体操作详见本章节描述。前提条件已创建Kafka集群。已安装Kafka客户端，详细可以参考安装客户端。已创建ClickHouse集群，并且ClickH

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse数据导入
修改MRS集群系统域名 - MapReduce服务 MRS

修改MRS集群系统域名操作场景每个系统用户安全使用的范围定义为“域”，不同的系统需要定义唯一的域名。FusionInsight Manager的域名在安装过程中生成，如果需要修改为特定域名，系统管理员可通过FusionInsight Manager进行配置。修改系统域名为高

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > 集群互信管理
配置MRS集群监控指标数据转储 - MapReduce服务 MRS

配置MRS集群监控指标数据转储监控指标数据转储介绍监控数据上报功能可以将系统中采集到的监控数据写入到文本文件，并以FTP或SFTP的形式上传到指定的服务器中。用户可以在Manager界面上配置监控指标数据对接参数，使集群内各监控指标数据保存到指定的FTP服务器，与第三方系统进行对接。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群监控指标
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS）操作场景本文将以“从SFTP服务器导入数据到HDFS”的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。本章节适用于MRS 3.x及后续版本。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS 操作场景本文将以从SFTP服务器导入数据到HDFS的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。前提条件已安装并配置Loader客户端，具体操作请参见使用客户端运行Loader作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤若您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

配置Hive业务使用其他组件的用户权限操作场景 Hive业务还可能需要关联使用其他组件，例如HQL语句触发MapReduce任务需要设置Yarn权限，或者Hive over HBase的场景需要HBase权限。以下介绍Hive关联Yarn和Hive over HBase两个场景下的操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive用户权限管理
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris 应用场景通过Doris创建Catalog成功读取RDS-MySQL数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist(

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
配置Container日志聚合功能 - MapReduce服务 MRS

配置Container日志聚合功能配置场景 Yarn提供了Container日志聚合功能，可以将各节点Container产生的日志收集到HDFS，释放本地磁盘空间。日志收集的方式有两种：应用完成后将Container日志一次性收集到HDFS。应用运行过程中周期性收集Container输出的日志片段到HDFS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
ClickHouse表创建 - MapReduce服务 MRS

ClickHouse表创建 ClickHouse依靠ReplicatedMergeTree引擎与ZooKeeper实现了复制表机制，用户在创建表时可以通过指定引擎选择该表是否高可用，每张表的分片与副本都是互相独立的。同时ClickHouse依靠Distributed引擎实现了分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
运行SparkSubmit作业 - MapReduce服务 MRS

运行SparkSubmit作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSubmit作业。 Spark是一个开源的并行数据处理框架，能够帮助用户简单、快速的开发，统一的大数据应用，对数据进行离线处理、流式处理、交互式分析等。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
安装客户端（2.x及之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致，可能影响部分功能的正常使用。

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明

总条数： 3068

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询集群详情 - MapReduce服务 MRS

同步Kafka数据至ClickHouse - MapReduce服务 MRS

修改MRS集群系统域名 - MapReduce服务 MRS

配置MRS集群监控指标数据转储 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

ClickHouse表创建 - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线