搜索_华为云

使用Loader从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

使用Loader从HDFS/OBS导出数据到SFTP服务器操作场景该任务指导用户使用Loader将数据从HDFS/OBS导出到SFTP服务器。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
常见概念 - MapReduce服务 MRS
常见概念 - MapReduce服务 MRS

常见概念 HBase表 HBase的表是三个维度排序的映射。从行主键、列主键和时间戳映射为单元格的值。所有的数据存储在HBase的表单元格中。列 HBase表的一个维度。列名称的格式为“<family>:<label>”，<family>和<label>为任意字符组合。表由<f

帮助中心 > MapReduce服务 MRS > 产品介绍
Spark2x基本原理 - MapReduce服务 MRS

Spark2x基本原理 Spark2x组件适用于MRS 3.x及后续版本。简介 Spark是基于内存的分布式计算框架。在迭代计算的场景下，数据处理过程中的数据可以存储在内存中，提供了比MapReduce高10到100倍的计算能力。Spark可以使用HDFS作为底层存储，使用户能

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
Spark常用配置参数 - MapReduce服务 MRS

Spark常用配置参数概述本节介绍Spark使用过程中的常用配置项。以特性为基础划分子章节，以便用户快速搜索到相应的配置项。如果用户使用MRS集群，本节介绍的参数大部分已经适配好，用户无需再进行配置。少数需要用户根据实际场景配置的参数，请参见快速配置Spark参数。配置Stage失败重试次数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导本章节指导用户修复log4j2的CVE-2021-44228漏洞。目前有两种方式可以采用如下两种方式修复：现有集群节点安装补丁扩容节点安装补丁前提条件从OBS路径中下载的补丁工具“MRS_Log4j_Patch

帮助中心 > MapReduce服务 MRS > 服务公告 > 漏洞公告
快速开发Kafka应用 - MapReduce服务 MRS

快速开发Kafka应用 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。 Kafka有如下几个特点：高吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
典型场景：从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到SFTP服务器操作场景该任务指导用户使用Loader将数据从HDFS/OBS导出到SFTP服务器。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取S

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
如何配置HBase双读能力 - MapReduce服务 MRS

如何配置HBase双读能力操作场景 HBase客户端应用通过自定义加载主备集群配置项，实现了双读能力。HBase双读作为提高HBase集群系统高可用性的一个关键特性，适用于四个查询场景：使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发常见问题
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
HDFS客户端写文件close失败 - MapReduce服务 MRS

HDFS客户端写文件close失败问题背景与现象 HDFS客户端写文件close失败，客户端提示数据块没有足够副本数。客户端日志： 2015-05-27 19:00:52.811 [pool-2-thread-3] ERROR: /tsp/nedata/collect/UGW

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
安装客户端（3.x之前版本） - MapReduce服务 MRS

安装客户端（3.x之前版本）操作场景用户需要使用MRS客户端。MRS集群客户端可以安装在集群内的Master节点或者Core节点，也可以安装在集群外节点上。 MRS 3.x之前版本集群在集群创建后，在主Master节点默认安装有客户端，可以直接使用，安装目录为“/opt/client”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
安装客户端（2.x及之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） MRS集群创建成功后，用户可自行安装集群客户端，用于连接集群内组件服务端，进行组件连接、作业提交等任务。集群客户端可以安装在集群内的节点上，也可以安装在集群外的节点上。集群内组件的服务端配置修改后，也建议重新安装客户端，否则客户端与服务端版本将不一致，可能影响部分功能的正常使用。

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据操作场景 distcp是一种在集群间或集群内部拷贝大量数据的工具。它利用MapReduce任务实现大量数据的分布式拷贝。前提条件已安装Yarn客户端或者包括Yarn的客户端。例如安装目录为“/opt/client”。各组件业务用户

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
导出Doris数据至HDFS - MapReduce服务 MRS

导出Doris数据至HDFS 数据导出（Export）功能可以将用户指定的表或分区的数据，以文本的格式通过Broker进程导出到远端存储上，如HDFS/对象存储（支持S3协议）等。不建议一次性导出大量数据。一个Export作业建议的导出数据量最大在几十GB。过大的导出会导致更多的垃圾文件和更高的重试成本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据分析
获取MRS应用开发样例工程 - MapReduce服务 MRS

获取MRS应用开发样例工程 MRS样例工程构建流程 MRS样例工程构建流程包括三个主要步骤：下载样例工程的Maven工程源码和配置文件，请参见获取MRS样例工程。配置华为镜像站中SDK的Maven镜像仓库，请参见配置华为开源镜像仓。根据用户自身需求，构建完整的Maven工程并进行编译开发。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
配置HBase主备集群容灾 - MapReduce服务 MRS

配置HBase主备集群容灾操作场景 HBase集群容灾作为提高HBase集群系统高可用性的一个关键特性，为HBase提供了实时的异地数据容灾功能。对外提供了基础的运维工具，包含灾备关系维护、重建、数据校验、查看数据同步进展等功能。为了实现数据的实时容灾，可以把本HBase集群中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中本章节为您介绍使用Maxwell同步工具将线下基于binlog的数据迁移到MRS Kafka集群中的指导。 Maxwell是一个开源程序（https://maxwells-daemon.io），通过读取MySQL的binlog日

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka常见问题
快速开发Spark应用 - MapReduce服务 MRS

快速开发Spark应用 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言的应用开发。通常适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative Computation）：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
配置FlinkServer作业重启策略 - MapReduce服务 MRS

配置FlinkServer作业重启策略 FlinkServer作业重启策略介绍 Flink支持不同的重启策略，以在发生故障时控制作业是否重启以及如何重启。如果不指定重启策略，集群会使用默认的重启策略。用户也可以在提交作业时指定一个重启策略，可参考如何创建FlinkServer作业在作业开发界面配置（MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析

总条数： 678

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Loader从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

常见概念 - MapReduce服务 MRS

Spark2x基本原理 - MapReduce服务 MRS

Spark常用配置参数 - MapReduce服务 MRS

Apache Log4j2 远程代码执行漏洞（CVE-2021-44228）修复指导 - MapReduce服务 MRS

快速开发Kafka应用 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

如何配置HBase双读能力 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

HDFS客户端写文件close失败 - MapReduce服务 MRS

安装客户端（3.x之前版本） - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

导出Doris数据至HDFS - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

配置FlinkServer作业重启策略 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线