搜索_华为云

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
在Linux环境中调测HBase应用 - MapReduce服务 MRS

在Linux环境中调测HBase应用操作场景 HBase应用程序支持在已安装或未安装HBase客户端的Linux环境中运行。在程序代码完成开发后，您可以上传Jar包至准备好的Linux运行环境中运行。前提条件已安装客户端时：已安装HBase客户端。当客户端所在主机不是集

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 调测HBase应用
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志操作场景 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端（MRS 3.x之前版本）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
准备连接HBase集群配置文件 - MapReduce服务 MRS

准备连接HBase集群配置文件准备集群认证用户信息对于开启Kerberos认证的MRS集群，需提前准备具有相关组件操作权限的用户用于程序认证。以下HBase权限配置示例供参考，在实际业务场景中可根据业务需求灵活调整。登录FusionInsight Manager。选择“集群

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境
Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导本章节指导用户修复log4j2的CVE-2021-44228漏洞。目前有两种方式可以采用如下两种方式修复：现有集群节点安装补丁扩容节点安装补丁前提条件从OBS路径中下载的补丁工具“MRS_Log4j_Patch

帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告
MRS 3.2.0-LTS.1补丁说明 - MapReduce服务 MRS

MRS 3.2.0-LTS.1补丁说明 MRS 3.2.0-LTS.1.7补丁基本信息表1 补丁基本信息补丁号 MRS 3.2.0-LTS.1.7 发布时间 2024-02-21 安装前处理如果MRS集群节点故障或者网络不通，需要先隔离该节点，否则补丁会安装失败。解决的问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist(

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
添加MySQL数据源 - MapReduce服务 MRS

添加MySQL数据源本章节适用于MRS 3.3.0及之后的版本。 HetuEngine支持配置MySQL数据源实现对MySQL数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加MySQL类型的JDBC数据源。添加MySQL数据源前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
准备Flink应用安全认证 - MapReduce服务 MRS

准备Flink应用安全认证 MRS服务集群开启了Kerberos认证需要执行以下步骤，没有开启Kerberos认证的集群忽略该步骤。在安全集群环境下，各个组件之间的相互通信不能够简单的互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交Flink应用程序时，需要

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 准备Flink应用开发环境
Flink客户端使用实践 - MapReduce服务 MRS

Flink客户端使用实践本节提供使用Flink运行wordcount作业的操作指导。前提条件 MRS集群中已安装Flink组件。集群正常运行，已安装集群客户端，例如安装目录为“/opt/hadoopclient”。以下操作的客户端目录只是举例，请根据实际安装目录修改。使用Flink客户端（MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端普通集群不需要执行2-6。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
快速使用Hive进行数据分析 - MapReduce服务 MRS

快速使用Hive进行数据分析 Hive是基于Hadoop的一个数据仓库工具，可将结构化的数据文件映射成一张数据库表，并提供类SQL的功能对数据进行分析处理，通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。背景信息

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
导出Doris数据至HDFS - MapReduce服务 MRS

导出Doris数据至HDFS 数据导出（Export）功能可以将用户指定的表或分区的数据，以文本的格式通过Broker进程导出到远端存储上，如HDFS/对象存储（支持S3协议）等。不建议一次性导出大量数据。一个Export作业建议的导出数据量最大在几十GB。过大的导出会导致更多的垃圾文件和更高的重试成本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
准备Flink安全认证 - MapReduce服务 MRS

准备Flink安全认证场景说明在安全集群环境下，各个组件之间的相互通信不能够简单的互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在提交Flink应用程序时，需要与Yarn、HDFS等之间进行通信。那么提交Flink的应用程序中需要设置安全认证，确保Flink程序能够正常运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
快速开发HDFS应用 - MapReduce服务 MRS

快速开发HDFS应用 HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
快速开发Spark应用 - MapReduce服务 MRS

快速开发Spark应用 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用

总条数： 1074

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

在Linux环境中调测HBase应用 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

准备连接HBase集群配置文件 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

MRS 3.2.0-LTS.1补丁说明 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

添加MySQL数据源 - MapReduce服务 MRS

准备Flink应用安全认证 - MapReduce服务 MRS

Flink客户端使用实践 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Hive进行数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

导出Doris数据至HDFS - MapReduce服务 MRS

准备Flink安全认证 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线