搜索_华为云

使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

使用Loader从HDFS导入数据到ClickHouse 操作场景该任务指导用户使用Loader将文件从HDFS导入到ClickHouse。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS目录和数据。 ClickH

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
MRS Hive对接外部LDAP配置说明 - MapReduce服务 MRS

MRS Hive对接外部LDAP配置说明应用场景本章节介绍Hive如何对接外部LDAP并访问HiveServer。为了管理集群中数据与资源的访问控制权限，在安全模式下，客户端应用程序在访问集群中的任意资源之前均需要通过身份认证，建立安全会话链接。 MRS通过KrbServe

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
MapReduce访问多组件样例代码 - MapReduce服务 MRS

MapReduce访问多组件样例代码功能介绍主要分为三个部分：从HDFS原文件中抽取name信息，查询HBase、Hive相关数据，并进行数据拼接，通过类MultiComponentMapper继承Mapper抽象类实现。获取拼接后的数据取最后一条输出到HBase、HDF

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式） > 开发MapReduce应用 > MapReduce访问多组件样例程序
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。使用Flink客户端前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

Hive基本原理 Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
准备连接Kafka集群配置文件 - MapReduce服务 MRS

准备连接Kafka集群配置文件准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户用于程序认证。以下Kafka权限配置示例供参考，在实际业务场景中可根据业务需求灵活调整。登录FusionInsight Manager。选择“集群

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路场景说明假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
使用Spark小文件合并工具说明 - MapReduce服务 MRS

使用Spark小文件合并工具说明工具介绍在Hadoop大规模生产集群中，由于HDFS的元数据都保存在NameNode的内存中，集群规模受制于NameNode单点的内存限制。如果HDFS中有大量的小文件，会消耗NameNode大量内存，还会大幅降低读写性能，延长作业运行时间。因

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
ClickHouse数据入库规范 - MapReduce服务 MRS

ClickHouse数据入库规范规则写本地表，查询分布式表，提升写入和查询性能，保证写入和查询的数据一致性。只有在去重诉求的场景下，可以使用分布式表插入，通过sharding key将要去重的数据转发到同一个shard，便于后续去重查询。外部模块保证数据导入的幂等性。 C

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp；同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路场景说明假设需要跨批次统计每个session期间发生了多少次event以及本session的开始和结束timestamp。同时输出本批次被更新状态的session。数据规划在kafka中生成模拟数据（需要有Kafka权限用户）。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
典型场景：从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

典型场景：从HDFS/OBS导入数据到HBase 操作场景该任务指导用户使用Loader将文件从HDFS/OBS导入到HBase。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。确保用户已授权

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
YARN REST API接口介绍 - MapReduce服务 MRS

YARN REST API接口介绍功能简介通过HTTP REST API来查看更多Yarn任务的信息。目前Yarn的REST接口只能进行一些资源或者任务的查询。完整和详细的接口请直接参考官网上的描述以了解其使用：http://hadoop.apache.org/docs/r3

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > YARN开发指南（安全模式） > YARN接口介绍
查看Flink应用调测结果 - MapReduce服务 MRS

查看Flink应用调测结果操作场景 Flink应用程序运行完成后，您可以查看运行结果数据，也可以通过Flink WebUI查看应用程序运行情况。操作步骤查看Flink应用运行结果数据。当用户查看执行结果时，需要在Flink的web页面上查看Task Manager的Stdout日志。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 调测Flink应用
提交Storm拓扑后Worker日志为空 - MapReduce服务 MRS

提交Storm拓扑后Worker日志为空现象描述在Eclipse中远程提交拓扑成功之后，无法在Storm WebUI查看拓扑的详细信息，并且每个拓扑的Bolt和Spout所在Worker节点在一直变化。查看Worker日志，日志内容为空。可能原因 Worker进程启动失败，

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
导入导出Hive数据库 - MapReduce服务 MRS

导入导出Hive数据库操作场景在大数据应用场景中，往往存在将Hive中的数据库及数据库下的所有表迁移到另一个集群上，使用Hive的导出导入数据库命令可以实现完整数据库的迁移。本章节内容适用于MRS 3.2.0及之后版本。 Hive数据库导入导出功能目前不支持对加密表、HBa

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive运维管理
查看Flink应用调测结果 - MapReduce服务 MRS

查看Flink应用调测结果操作场景 Flink应用程序运行完成后，您可以查看运行结果数据，也可以通过Flink WebUI查看应用程序运行情况。操作步骤查看Flink应用运行结果数据。当用户查看执行结果时，需要在Flink的web页面上查看Task Manager的Stdout日志。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 调测Flink应用
Flink REST API接口介绍 - MapReduce服务 MRS

Flink REST API接口介绍 Flink具有可用于查询正在运行的作业的状态和统计信息以及最近完成作业的监视API。该监视API由Flink自己的WEB UI使用。监视API是REST API，可接受HTTP GET请求并使用JSON数据进行响应。REST API是访问W

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
准备连接HBase集群配置文件 - MapReduce服务 MRS

准备连接HBase集群配置文件准备运行环境配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，需要与MRS集群内节点网络互通，同时配置hosts域名信息。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 准备HBase应用开发环境
HDFS Colocation - MapReduce服务 MRS
HDFS Colocation - MapReduce服务 MRS

HDFS Colocation 功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用

总条数： 1693

上一页
1
...
76
77
78
...
85
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Loader从HDFS导入数据到ClickHouse - MapReduce服务 MRS

MRS Hive对接外部LDAP配置说明 - MapReduce服务 MRS

MapReduce访问多组件样例代码 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

准备连接Kafka集群配置文件 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

ClickHouse数据入库规范 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

典型场景：从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

YARN REST API接口介绍 - MapReduce服务 MRS

查看Flink应用调测结果 - MapReduce服务 MRS

提交Storm拓扑后Worker日志为空 - MapReduce服务 MRS

导入导出Hive数据库 - MapReduce服务 MRS

查看Flink应用调测结果 - MapReduce服务 MRS

Flink REST API接口介绍 - MapReduce服务 MRS

准备连接HBase集群配置文件 - MapReduce服务 MRS

HDFS Colocation - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线