搜索_华为云

HDFS应用开发规则 - MapReduce服务 MRS

HDFS应用开发规则 HDFS NameNode元数据存储路径 NameNode元数据信息的默认存储路径为“${BIGDATA_DATA_HOME}/namenode/data”，该参数用于确定HDFS文件系统的元数据信息的保存路径。 HDFS需要开启NameNode镜像备份 NameNode的镜像备份参数为“fs

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
Yarn节点配置调优 - MapReduce服务 MRS

Yarn节点配置调优操作场景合理配置大数据集群的调度器后，还可通过调节每个节点的可用内存、CPU资源及本地磁盘的配置进行性能调优。具体包括以下配置项：可用内存 CPU虚拟核数物理CPU使用百分比内存和CPU资源的协调本地磁盘操作步骤若您需要对参数配置进行调整，具体操作请参考修改集群服务配置参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
运行SparkSubmit作业 - MapReduce服务 MRS

运行SparkSubmit作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个SparkSubmit作业。 Spark是一个开源的并行数据处理框架，能够帮助用户简单、快速的开发，统一的大数据应用，对数据进行离线处理、流式处理、交互式分析等。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
安装客户端（2.x及之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致，可能影响部分功能的正常使用。

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
ClickHouse表创建 - MapReduce服务 MRS

ClickHouse表创建 ClickHouse依靠ReplicatedMergeTree引擎与ZooKeeper实现了复制表机制，用户在创建表时可以通过指定引擎选择该表是否高可用，每张表的分片与副本都是互相独立的。同时ClickHouse依靠Distributed引擎实现了分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
配置Container日志聚合功能 - MapReduce服务 MRS

配置Container日志聚合功能配置场景 Yarn提供了Container日志聚合功能，可以将各节点Container产生的日志收集到HDFS，释放本地磁盘空间。日志收集的方式有两种：应用完成后将Container日志一次性收集到HDFS。应用运行过程中周期性收集Container输出的日志片段到HDFS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引操作场景本章节只适用于Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
Spark应用开发常用概念 - MapReduce服务 MRS

Spark应用开发常用概念基本概念 RDD 即弹性分布数据集（Resilient Distributed Dataset），是Spark的核心概念。指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。 RDD的生成：从HDFS输入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Flux开发指引 - MapReduce服务 MRS
Flux开发指引 - MapReduce服务 MRS

Flux开发指引操作场景本章节只适用于MRS产品中Storm组件使用Flux框架提交和部署拓扑的场景。本章中描述的jar包的具体版本信息请以实际情况为准。 Flux框架是Storm 0.10.0版本提供的提高拓扑部署易用性的框架。通过Flux框架，用户可以使用yaml文件来定义和部署拓扑，并且最终通过storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > Storm应用开发常见问题
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从SFTP服务器导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
查询单个作业信息 - MapReduce服务 MRS

查询单个作业信息功能介绍在MRS集群中查询指定作业的详细信息。接口约束无调用方法请参见如何调用API。 URI GET /v2/{project_id}/clusters/{cluster_id}/job-executions/{job_execution_id} 表1

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 作业管理接口
MRS集群用户账号一览表 - MapReduce服务 MRS

MRS集群用户账号一览表本章节介绍MRS集群内的相关默认用户信息。账号一览表（MRS 3.x及之后版本）用户分类 MRS集群提供以下3类用户，请系统管理员定期修改密码，不建议使用默认密码。用户类型使用说明系统用户通过FusionInsight Manager创建，是

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户
集群操作默认标签 - MapReduce服务 MRS

集群操作默认标签功能介绍对已有集群启用或关闭集群默认标签。开启后，集群内节点会打上集群默认标签。调用方法请参见如何调用API。 URI POST /v2/{project_id}/clusters/{cluster_id}/tags/switch 表1 路径参数参数是否必选

 帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 标签管理接口
快速配置Spark参数 - MapReduce服务 MRS

快速配置Spark参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
查询主机列表 - MapReduce服务 MRS

查询主机列表功能介绍该接口用于查询输入集群的主机列表详情。接口约束无调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/hosts 表1 路径参数参数是否必选参数类型描述 cluster_id

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口

总条数： 3075

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HDFS应用开发规则 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

运行SparkSubmit作业 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

ClickHouse表创建 - MapReduce服务 MRS

配置Container日志聚合功能 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

Storm Flux开发指引 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

Flux开发指引 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

查询单个作业信息 - MapReduce服务 MRS

MRS集群用户账号一览表 - MapReduce服务 MRS

集群操作默认标签 - MapReduce服务 MRS

快速配置Spark参数 - MapReduce服务 MRS

查询主机列表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线