搜索_华为云

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

hdfs://cluster1/foo/bar hdfs://cluster2/bar/foo 集群cluster1和集群cluster2之间的网络必须保持互通，且两个集群需要使用相同或兼容的HDFS版本。多个源目录的数据拷贝，示例如下： hadoop distcp hdfs://cluster1/foo/a

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
安装客户端（2.x及之前版本） - MapReduce服务 MRS

弹性云服务器的CPU架构需和MRS集群节点保持一致。弹性云服务器客户端安装目录需要分配足够的磁盘空间，至少40GB。弹性云服务器需要与MRS集群在同一个VPC网络及安全组中。 MRS集群安全组入方向将所有端口对客户端节点放开，具体操作请参考添加安全组规则。弹性云服务器操作系统已安装NTP服务，且NTP服务运行正常。

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
配置HBase主备集群容灾 - MapReduce服务 MRS

通写数据与Bulkload批量写数据场景下的容灾。前提条件主备集群都已经安装并启动成功，且获取集群的管理员权限。必须保证主备集群间的网络畅通和端口的使用。如果主集群部署为安全模式且不由一个FusionInsight Manager管理，主备集群必须已配置跨集群互信。如果主

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
HDFS客户端写文件close失败 - MapReduce服务 MRS

BlockManager.logAddStoredBlock(BlockManager.java:2393) DataNode上报块写成功通知延迟的原因可能有：网络瓶颈导致、CPU瓶颈导致。如果此时再次调用close或者close的retry的次数增多，那么close都将返回成功。建议适当增大参数dfs

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
获取MRS应用开发样例工程 - MapReduce服务 MRS

本地环境使用开发工具下载依赖的jar包前，需要确认以下信息。确认本地环境网络正常。打开浏览器访问：华为提供开源镜像站（网址为https://mirrors.huaweicloud.com/），查看网站是否能正常访问。如果访问异常，请先开通本地网络。确认当前开发工具是否开启代理。下载jar包前需要确保开发工具代理关闭。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

存储系统上（比如HDFS）。因为Driver程序在集群上调度任务，所以Driver程序建议和worker节点比较近，比如在一个相同的局部网络内。 Spark on YARN有两种部署模式： yarn-cluster模式下，Spark的Driver会运行在YARN集群内的Appl

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

等操作转为JSON格式发送到输出端(如控制台/文件/Kafka等)。Maxwell可部署在MySQL机器上，也可独立部署在其他与MySQL网络可通的机器上。 Maxwell运行在Linux服务器上，常见的有EulerOS、Ubuntu、Debian、CentOS、OpenSUSE等，且需要Java

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka常见问题
快速开发Spark应用 - MapReduce服务 MRS

jar”。上传jar包及准备源数据将编译后的jar包上传到客户端节点，例如上传到“/opt/client/sparkdemo”目录下。如果本地网络无法直接连接客户端节点上传文件，可先将jar文件或者源数据上传至OBS文件系统中，然后通过MRS管理控制台集群内的“文件管理”页面导入HD

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

jar”。步骤3：上传jar包及源数据将编译后的jar包上传到客户端节点，例如上传到“/opt/client/lib”目录下。如果本地网络无法直接连接客户端节点上传文件，可先将jar文件或者源数据上传至OBS文件系统中，然后通过MRS管理控制台集群内的“文件管理”页面导入HD

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark应用开发常用概念 - MapReduce服务 MRS

时，每一条输出结果需要按key哈希，并且分发到对应的Reducer上去，这个过程就是shuffle。由于shuffle涉及到了磁盘的读写和网络的传输，因此shuffle性能的高低直接影响到了整个程序的运行效率。下图清晰地描述了MapReduce算法的整个流程。图3 算法流程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

按照MRS集群实际使用时长计费。区域华北-北京四选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。集群名称 mrs_demo 待创建的MRS集群名称。集群类型自定义根据业务实际需要选择待创建的MRS集群类型。

帮助中心 > MapReduce服务 MRS > 快速入门
典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

为了提高导入数据速度，需要确保以下条件：每个Map连接时，相当于一个客户端连接，因此需要确保SFTP服务器最大连接数大于Map数量。确保SFTP服务器上的磁盘IO或是网络带宽都未达到上限。 20 Map数据块大小配置数据操作的MapReduce任务中启动map所处理的数据大小，单位为MB。参数值必须大于或

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

等操作转为JSON格式发送到输出端(如控制台/文件/Kafka等)。Maxwell可部署在MySQL机器上，也可独立部署在其他与MySQL网络可通的机器上。 Maxwell运行在Linux服务器上，常见的有EulerOS、Ubuntu、Debian、CentOS、OpenSUSE等，且需要Java

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

按照MRS集群实际使用时长计费。区域华北-北京四选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。集群名称 mrs_demo 待创建的MRS集群名称。集群类型自定义根据实际业务需要选择待创建的MRS集群类型。

帮助中心 > MapReduce服务 MRS > 快速入门
使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

为了提高导入数据速度，需要确保以下条件：每个Map连接时，相当于一个客户端连接，因此需要确保SFTP服务器最大连接数大于Map数量。确保SFTP服务器上的磁盘IO或是网络带宽都未达到上限。 20 Map数据块大小配置数据操作的MapReduce任务中启动map所处理的数据大小，单位为MB。参数值必须大于或

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

CDM集群的规格，按待迁移的数据量选择，一般选择cdm.medium即可，满足大部分迁移场景。 CDM集群所在VPC、子网、安全组，选择与MRS集群所在的网络一致。 CDM集群创建完成后，选择集群操作列的“绑定弹性IP”，CDM通过EIP访问MySQL。图3 集群列表如果用户对本地数据源的访

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

ZhangSan LiSi WangwWU Tom Jemmmy LinDa 将编译后的jar包上传到客户端节点，例如上传到“/opt”目录。如果本地网络无法直接连接客户端节点上传文件，可先将jar文件或者源数据上传至OBS文件系统中，然后通过MRS管理控制台集群内的“文件管理”页面导入HD

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

计费模式选择待创建的MRS集群的计费模式。按需计费区域选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。华北-北京四集群名称待创建的MRS集群名称。 MRS_demo 集群类型待创建的MRS集群类型。选择“自定义”

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

ord=true参数启用记录。前提条件已创建包含Doris服务的集群，集群内各服务运行正常。待连接Doris数据库的节点与MRS集群网络互通。创建具有Doris管理权限的用户。集群已启用Kerberos认证（安全模式）在FusionInsight Manager中创建

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris数据导入
快速创建和使用Kafka流式数据处理集群 - MapReduce服务 MRS

按照MRS集群实际使用时长计费。区域华北-北京四选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。集群名称 mrs_demo 待创建的MRS集群名称。集群类型自定义根据业务实际需要选择待创建的MRS集群类型。

帮助中心 > MapReduce服务 MRS > 快速入门

总条数： 731

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

HDFS客户端写文件close失败 - MapReduce服务 MRS

获取MRS应用开发样例工程 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

快速开发Spark应用 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

典型场景：从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

基于binlog的MySQL数据同步到MRS集群中 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

使用Loader从SFTP服务器导入数据到HDFS/OBS - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

使用Stream Load方式导入数据至Doris - MapReduce服务 MRS

快速创建和使用Kafka流式数据处理集群 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线