搜索_华为云

查询集群列表 - MapReduce服务 MRS

查询集群列表功能介绍查看用户创建的集群列表信息。该接口不兼容Sahara。接口约束无调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/cluster_infos 表1 路径参数参数是否必选参数类型描述 project_id 是

 帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

配置Hive业务使用其他组件的用户权限操作场景 Hive业务还可能需要关联使用其他组件，例如HQL语句触发MapReduce任务需要设置Yarn权限，或者Hive over HBase的场景需要HBase权限。以下介绍Hive关联Yarn和Hive over HBase两个场景下的操作

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive用户权限管理
运行SparkSql作业 - MapReduce服务 MRS

运行SparkSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSql作业。 SparkSql作业用于查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
通过Hue管理HDFS文件 - MapReduce服务 MRS

通过Hue管理HDFS文件操作场景 Hue提供了文件浏览器功能，使用户可以通过界面图形化的方式使用HDFS。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue > 创建Hue操作任务
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤如果您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
HDFS应用开发规则 - MapReduce服务 MRS

HDFS应用开发规则 HDFS NameNode元数据存储路径 NameNode元数据信息的默认存储路径为“${BIGDATA_DATA_HOME}/namenode/data”，该参数用于确定HDFS文件系统的元数据信息的保存路径。 HDFS需要开启NameNode镜像备份 NameNode

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤若您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris 应用场景通过Doris创建Catalog成功读取RDS-MySQL数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist()

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
运行SparkSubmit作业 - MapReduce服务 MRS

运行SparkSubmit作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSubmit作业。 Spark是一个开源的并行数据处理框架，能够帮助用户简单、快速的开发，统一的大数据应用，对数据进行离线处理、流式处理、交互式分析等

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理企业中的使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
安装客户端（2.x及之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致

 帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
ClickHouse表创建 - MapReduce服务 MRS

ClickHouse表创建 ClickHouse依靠ReplicatedMergeTree引擎与ZooKeeper实现了复制表机制，用户在创建表时可以通过指定引擎选择该表是否高可用，每张表的分片与副本都是互相独立的。同时ClickHouse依靠Distributed引擎实现了分布式表机制

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
配置Container日志聚合功能 - MapReduce服务 MRS

配置Container日志聚合功能配置场景 Yarn提供了Container日志聚合功能，可以将各节点Container产生的日志收集到HDFS，释放本地磁盘空间。日志收集的方式有两种：应用完成后将Container日志一次性收集到HDFS。应用运行过程中周期性收集Container

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入创建

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg(

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Flux开发指引 - MapReduce服务 MRS
Flux开发指引 - MapReduce服务 MRS

Flux开发指引操作场景本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm 0.10.0版本提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发常见问题

总条数： 2966

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询集群列表 - MapReduce服务 MRS

配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

运行SparkSql作业 - MapReduce服务 MRS

通过Hue管理HDFS文件 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

HDFS应用开发规则 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

ClickHouse表创建 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

Flux开发指引 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线