搜索_华为云

YARN REST API接口介绍 - MapReduce服务 MRS

YARN REST API接口介绍功能简介通过HTTP REST API来查看更多Yarn任务的信息。目前Yarn的REST接口只能进行一些资源或者任务的查询。完整和详细的接口请直接参考官网上的描述以了解其使用：http://hadoop.apache.org/docs/r3.1.1

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > YARN开发指南（安全模式） > YARN接口介绍
使用Keytab文件进行Session安全认证 - MapReduce服务 MRS

使用Keytab文件进行Session安全认证功能简介使用Keytab文件进行Session认证。准备操作登录FusionInsight Manager，选择“系统 > 权限 > 用户”，下载参考准备MRS应用开发用户准备的开发用户的认证凭据。代码样例以下代码片段仅为演示

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 准备IoTDB应用开发环境 > 配置IoTDB应用安全认证
IoTDB Kafka样例程序 - MapReduce服务 MRS

IoTDB Kafka样例程序功能简介该样例介绍如何通过Kafka将数据发送到IoTDB。代码样例 Producer.java：该样例展示如何将时序数据发送到Kafka集群。根据实际场景，修改“KafkaProperties.java”文件中的“TOPIC”变量，例如：public

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 开发IoTDB应用
准备连接集群配置文件 - MapReduce服务 MRS

准备连接集群配置文件准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户用于程序认证。以下Flink权限配置示例供参考，在实际业务场景中可根据业务需求灵活调整。登录FusionInsight Manager。选择“系统 > 权限

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
ClickHouse索引设计 - MapReduce服务 MRS

ClickHouse索引设计一级索引设计在建表设计时指定主键字段的建议：按查询时最常使用且过滤性最高的字段作为主键。依次按照访问频度从高到低、维度基数从小到大来排列。数据是按照主键排序存储的，查询的时候，通过主键可以快速筛选数据，合理的主键设计，能够大大减少读取的数据量，提升查询性能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse数据库设计规范 > ClickHouse数据库设计 > ClickHouse宽表设计
YARN REST API接口介绍 - MapReduce服务 MRS

YARN REST API接口介绍功能简介通过HTTP REST API来查看更多Yarn任务的信息。目前Yarn的REST接口只能进行一些资源或者任务的查询。完整和详细的接口请直接参考官网上的描述以了解其使用： http://hadoop.apache.org/docs/r3.1.1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > YARN开发指南（安全模式） > YARN接口介绍
Hudi表索引设计规范 - MapReduce服务 MRS

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
安装客户端（3.x及之后版本） - MapReduce服务 MRS

安装客户端（3.x及之后版本）操作场景该操作指导用户在MRS集群创建成功后安装MRS集群所有服务（不包含Flume）的客户端。Flume客户端安装请参见安装Flume客户端。客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。修改集群内组件的服务端配置后，建议重新安装客户端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
Kafka基本原理 - MapReduce服务 MRS
Kafka基本原理 - MapReduce服务 MRS

Kafka基本原理 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Kafka
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象问题背景与现象当数据量较大时会频繁地发生rebalance导致出现重复消费的情况，关键日志如下： 2018-05-12 10:58:42,561 | INFO | [kafka-request-handler-3] | [GroupCoordinator

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark Jupyter对接方案概述在MRS服务中可以配合Jupyter Notebook使用PySpark，能够提高机器学习、数据探索和ETL应用开发效率。本实践指导用户如何在MRS集群中配置Jupyter Notebook来使用

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
创建MRS集群用户 - MapReduce服务 MRS

创建MRS集群用户默认情况下，系统只有一个用户“admin”具有Manager最高操作权限。管理员应根据实际业务场景需要，通过Manager创建新用户并指定其操作权限以满足业务使用。 MRS 3.x及之后版本，FusionInsight Manager最大支持50000个用户（包括系统内置用户

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群用户 > 管理MRS集群用户
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡配置场景 DiskBalancer是一个在线磁盘均衡器，旨在根据各种指标重新平衡正在运行的DataNode上的磁盘数据。工作方式与HDFS的Balancer工具类似。不同的是，HDFS Balancer工具用于DataNode节点间的数据均衡

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Kafka用户权限说明 - MapReduce服务 MRS

Kafka用户权限说明操作场景在启用Kerberos认证的集群中，用户使用Kafka前需要拥有对应的权限。MRS集群支持将Kafka的使用权限，授予不同用户。 Kafka默认用户组如表1所示。 Kafka支持两种鉴权插件：“Kafka开源自带鉴权插件”和“Ranger鉴权插件”

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka用户权限管理
Hudi数据表Compaction规范 - MapReduce服务 MRS

Hudi数据表Compaction规范 mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
HDFS on Hue - MapReduce服务 MRS
HDFS on Hue - MapReduce服务 MRS

HDFS on Hue Hue提供了文件浏览器功能，使用户可以通过界面图形化的方式使用HDFS。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist()

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 Structured Streaming支持的功能支持对流式数据的ETL操作。支持流式DataFrames或Datasets的schema推断和分区。流式DataFrames或Datasets上的操作：包括无类型，类似

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
导入并配置ClickHouse样例工程 - MapReduce服务 MRS

导入并配置ClickHouse样例工程背景信息获取ClickHouse开发样例工程，将工程导入到IntelliJ IDEA开始样例学习。前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若无法确定，请联系系统管理员。集群的时间可通过FusionInsight Manager

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（普通模式） > 准备ClickHouse应用开发环境

总条数： 782

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

YARN REST API接口介绍 - MapReduce服务 MRS

使用Keytab文件进行Session安全认证 - MapReduce服务 MRS

IoTDB Kafka样例程序 - MapReduce服务 MRS

准备连接集群配置文件 - MapReduce服务 MRS

ClickHouse索引设计 - MapReduce服务 MRS

YARN REST API接口介绍 - MapReduce服务 MRS

Hudi表索引设计规范 - MapReduce服务 MRS

安装客户端（3.x及之后版本） - MapReduce服务 MRS

Kafka基本原理 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

创建MRS集群用户 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

Kafka用户权限说明 - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

HDFS on Hue - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

导入并配置ClickHouse样例工程 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线