搜索_华为云

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase 操作场景该任务指导用户使用Flume客户端从本地采集静态日志保存到HBase表：flume_test。该场景介绍的是多级agent串联操作。本章节适用于MRS 3.x及之后版本。本配置默认集群网络环境是安全的，数据传

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase 该任务指导用户使用Flume客户端从本地采集静态日志保存到HBase表：flume_test。该场景介绍的是多级agent串联操作。本配置默认集群网络环境是安全的，数据传输过程不需要启用SSL认证。如需使用加密方式，请参

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > 配置Flume非加密传输数据采集任务
HDFS开源增强特性 - MapReduce服务 MRS

HDFS开源增强特性 HDFS开源增强特性：文件块同分布（Colocation）离线数据汇总统计场景中，Join是一个经常用到的计算功能，在MapReduce中的实现方式大体如下： Map任务分别将两个表文件的记录处理成（Join Key，Value），然后按照Join Key

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
MRS集群部署方案说明 - MapReduce服务 MRS

MRS集群部署方案说明 MRS当前提供的“分析集群”、“流式集群”和“混合集群”采用固定模板进行部署集群的进程，无法满足用户自定义部署管理角色和控制角色在集群节点中的需求。如需自定义集群部署方式，可在创建集群时的“集群类型”选择“自定义”，实现用户自主定义集群的进程实例在集群节点中的部署方式。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群规划 > MRS集群部署说明
使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 Spark BulkLoad工具支持快速同步Hive或Spark表数据到HBase表中，支持全量或增量导入ORC/PAQUET等格式的表数据。使用Spark BulkLoad同步数据类型数据到HBase表中时，存在以下限制：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据应用场景经常面临向HBase中导入大量数据的情景，向HBase中批量加载数据的方式有很多种，最直接方式是调用HBase的API使用put方法插入数据；另外一种是用MapReduce的方式从HDFS上加载数据。但是这两种方式效率

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
ClickHouse SQL调优 - MapReduce服务 MRS

ClickHouse SQL调优规则合理使用数据表的分区字段和索引字段。 MergeTree引擎，数据是以分区目录的形式进行组织存储的，在进行的数据查询时，使用分区可以有效跳过无用的数据文件，减少数据的读取。 MergeTree引擎会根据索引字段进行数据排序，并且根据inde

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库调优
开源sqoop-shell工具使用示例（Oracle - HBase） - MapReduce服务 MRS

开源sqoop-shell工具使用示例（Oracle - HBase）操作场景本文将以“从Oracle导入数据到HBase”的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。本章节适用于MRS 3.x及后续版本。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用sqoop-shell工具导入数据到HBase - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HBase 操作场景本文将以从Oracle导入数据到HBase的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。前提条件已安装并配置Loader客户端，具体操作请参见使用客户端运行Loader作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
配置Flink应用安全认证 - MapReduce服务 MRS

配置Flink应用安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单地互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交Flink应用程序时，需要与Yarn、HDFS等之间进行通信。那么提交Flink的应用程序中需要设置安全认证，确保Flink程序能够正常运行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 准备Flink应用开发环境
离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

离线数据加载：通过StreamLoad将本地CSV文件导入Doris 应用场景本地CSV文件数据通过StreamLoad导入到Doris，需要写入Doris的数据不重复，通过引入 Unique 数据模型保证 Key 的唯一性。方案架构离线数据可以从数据湖加载，也可以直接加载

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
配置Spark应用安全认证 - MapReduce服务 MRS

配置Spark应用安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单的互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在开发Spark应用程序时，某些场景下，需要Spark与Hadoop、HBase等之间进行通信。那么Spark应用程序中需要写入

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
配置Spark应用安全认证 - MapReduce服务 MRS

配置Spark应用安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单的互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在开发Spark应用程序时，某些场景下，需要Spark与Hadoop、HBase等之间进行通信。那么Spark应用程序中需要写入

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS）操作场景本文将以“从SFTP服务器导入数据到HDFS”的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。本章节适用于MRS 3.x及后续版本。前提条件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS 操作场景本文将以从SFTP服务器导入数据到HDFS的作业为例，介绍如何分别在交互模式和批量模式下使用sqoop-shell工具进行创建和启动Loader作业。前提条件已安装并配置Loader客户端，具体操作请参见使用客户端运行Loader作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
配置Spark应用安全认证 - MapReduce服务 MRS

配置Spark应用安全认证前提条件 MRS服务集群开启了Kerberos认证。场景说明在集群开启Kerberos认证的环境下，各个组件之间的相互通信不能够简单地互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在开发Spark应用程序时，某些场景下，需要Spar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
Flink性能调优建议 - MapReduce服务 MRS

Flink性能调优建议 Hudi MOR流表开启log Index特性提升Flink流读Mor表性能 Hudi的Mor表可以通过log index提升读写性能，在Sink和Source表添加属性 'hoodie.log.index.enabled'='true'。通过调整对应算子并行度提升性能

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
Flume业务配置指南 - MapReduce服务 MRS

Flume业务配置指南本章节适用于MRS 3.x及之后版本。该操作指导用户完成Flume常用业务的配置。其他一些不太常用的Source、Channel、Sink的配置请参考Flume社区提供的用户手册（http://flume.apache.org/releases/1.9.0

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
快速开发HDFS应用 - MapReduce服务 MRS

快速开发HDFS应用 HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发HBase应用 - MapReduce服务 MRS

快速开发HBase应用 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用

总条数： 746

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HBase - MapReduce服务 MRS

HDFS开源增强特性 - MapReduce服务 MRS

MRS集群部署方案说明 - MapReduce服务 MRS

使用Spark BulkLoad工具同步数据到HBase表中 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

ClickHouse SQL调优 - MapReduce服务 MRS

开源sqoop-shell工具使用示例（Oracle - HBase） - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HBase - MapReduce服务 MRS

配置Flink应用安全认证 - MapReduce服务 MRS

离线数据加载：通过StreamLoad将本地CSV文件导入Doris - MapReduce服务 MRS

配置Spark应用安全认证 - MapReduce服务 MRS

配置Spark应用安全认证 - MapReduce服务 MRS

开源sqoop-shell工具使用示例（SFTP - HDFS） - MapReduce服务 MRS

使用sqoop-shell工具导入数据到HDFS - MapReduce服务 MRS

配置Spark应用安全认证 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

Flume业务配置指南 - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

快速开发HBase应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线