搜索_华为云

MRS集群日志概述 - MapReduce服务 MRS

文件操作创建文件夹创建文件打开文件追加文件内容修改文件名称删除文件/文件夹设置文件时间属性设置文件副本个数多文件合并文件系统检查文件链接 Hive审计日志元数据操作元数据定义，如创建数据库、表等元数据删除，如删除数据库、表等元数据修改，如增加列、重命名表等

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

已经创建包含有Hadoop服务的MRS集群。拥有EIP配额并创建EIP。步骤1：创建CDM集群并绑定EIP 如果是独立CDM服务，参考创建集群创建CDM集群；如果是作为DataArts Studio服务CDM组件使用，参考创建集群创建CDM集群。关键配置如下： CDM集群的规

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
快速开发HDFS应用 - MapReduce服务 MRS

快速开发HDFS应用 HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。如需使用Hudi，请确保MRS集群内已安装Spark/Spark2x服务。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 HDFS简介 HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，适合大规模数据集应用。 HDFS适用于如下场景。处理海量数据（TB或PB级别以上）需要很高的吞吐量

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发概述
Alluxio样例程序开发思路 - MapReduce服务 MRS

如设置文件权限等，其他操作可以在掌握本代码样例之后，再扩展学习。本代码样例讲解顺序为：文件系统初始化写文件读文件开发思路调用FileSystem中的create接口获取文件系统客户端调用FileSystem中的crteateFile接口创建文件调用FileOutStream中的wirte接口写文件

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南 > 开发Alluxio应用
准备MRS应用开发用户 - MapReduce服务 MRS

服务是否启用了Ranger鉴权？是，执行3。否，编辑角色，根据服务的权限控制类别添加业务开发时需要的权限，参见表1。表1 权限列表服务所需添加权限 HDFS 在“配置资源权限”的表格中选择“待操作集群的名称 > HDFS > 文件系统”，勾选“hdfs://haclus

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版）
从零开始使用Spark SQL - MapReduce服务 MRS

上传数据至OBS。登录OBS控制台。单击“并行文件系统 > 创建并行文件系统”，创建一个名称为sparksql的文件系统。 sparksql仅为示例，文件系统名称必须全局唯一，否则会创建并行文件系统失败。单击sparksql文件系统名称，并选择“文件”。单击“新建文件夹”，创建input文件夹。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark（MRS 3.x之前版本）
配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

Mover命令迁移数据配置场景 Mover是一个新的数据迁移工具，工作方式与HDFS的Balancer接口工作方式类似。Mover能够基于设置的数据存储策略，将集群中的数据重新分布。通过运行Mover，周期性地检测HDFS文件系统中用户指定的HDFS文件或目录，判断该文件或目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
加载数据到Hive表中 - MapReduce服务 MRS

加载数据到Hive表中功能介绍本小节介绍了如何使用HQL向已有的表employees_info中加载数据。从本节中可以掌握如何从本地文件系统、MRS集群中加载数据。以关键字LOCAL区分数据源是否来自本地。在启用了安全服务的集群中执行如下操作，需要在数据库中具有UPDATE

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
加载数据到Hive表中 - MapReduce服务 MRS

加载数据到Hive表中功能介绍本小节介绍了如何使用HQL向已有的表employees_info中加载数据。从本节中可以掌握如何从本地文件系统、MRS集群中加载数据。以关键字LOCAL区分数据源是否来自本地。在启用了安全服务的集群中执行如下操作，需要在数据库中具有UPDATE

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

Mover命令迁移数据配置场景 Mover是一个新的数据迁移工具，工作方式与HDFS的Balancer接口工作方式类似。Mover能够基于设置的数据存储策略，将集群中的数据重新分布。通过运行Mover，周期性地检测HDFS文件系统中用户指定的HDFS文件或目录，判断该文件或目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
配置HDFS单目录文件数量 - MapReduce服务 MRS

操作场景通常一个集群上部署了多个服务，且大部分服务的存储都依赖于HDFS文件系统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划，防止单个目录下的文件数目超过阈值，导致任务出错。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Loader基本原理 - MapReduce服务 MRS

Loader基本原理 Loader是在开源Sqoop组件的基础上进行了一些扩展，实现MRS与关系型数据库、文件系统之间交换“数据”、“文件”，同时也可以将数据从关系型数据库或者文件服务器导入到HDFS/HBase中，或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
概述 - MapReduce服务 MRS
概述 - MapReduce服务 MRS

概述 “数据导入”章节适用于MRS 3.x及后续版本。简介 Loader是实现MRS与外部数据源如关系型数据库、SFTP服务器、FTP服务器之间交换数据和文件的ETL工具，支持将数据或文件从关系型数据库或文件系统导入到MRS服务中。 Loader支持如下数据导入方式：从关系型数据库导入数据到HDFS/OBS。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
配置HDFS单目录文件数量 - MapReduce服务 MRS

操作场景通常一个集群上部署了多个服务，且大部分服务的存储都依赖于HDFS文件系统。当集群运行时，不同组件（例如Spark、Yarn）或客户端可能会向同一个HDFS目录不断写入文件。但HDFS系统支持的单目录文件数目是有上限的，因此用户需要提前做好规划，防止单个目录下的文件数目超过阈值，导致任务出错。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

本特性仅适用于MRS 3.2.0及之后版本。此章节仅说明分区表指定存储源的能力，关于Hive如何在存算分离场景下对接OBS，对接指导可参考Hive对接OBS文件系统章节。前提条件已安装Hive客户端。操作示例以Hive客户端安装用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
MapReduce与其他组件的关系 - MapReduce服务 MRS

MapReduce与其他组件的关系 MapReduce和HDFS的关系 HDFS是Hadoop分布式文件系统，具有高容错和高吞吐量的特性，可以部署在价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在MapR

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
CALL - MapReduce服务 MRS
CALL - MapReduce服务 MRS

这与连接器定义的存储过程不同，是无法被CALL调用的。检查并更新metastroe中分区数组，它支持3种模式： ADD：将文件系统中存在但metastore里没有的分区系统同步到metastroe中。 DROP：drop元数据表中存在但文件系统中不存在的分区。 FULL：同时进行ADD和DROP操作。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine辅助命令语法
样例：通过Loader将数据从OBS导入HDFS - MapReduce服务 MRS

“目的连接”选择已创建的HDFS连接。在“自”填写源连接参数。在“桶名”填写业务数据所保存的OBS文件系统名称。在“源目录或文件”填写业务数据在文件系统的具体位置。如果是单个文件，需要填写包含文件名的完整路径。如果是目录，填写目录的完整路径 “文件格式”填写业务数据文件的类型。可参见obs-connector。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader

总条数： 520

上一页
1
...
10
11
12
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS集群日志概述 - MapReduce服务 MRS

使用CDM服务迁移MRS HDFS数据至OBS - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

Alluxio样例程序开发思路 - MapReduce服务 MRS

准备MRS应用开发用户 - MapReduce服务 MRS

从零开始使用Spark SQL - MapReduce服务 MRS

配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

加载数据到Hive表中 - MapReduce服务 MRS

加载数据到Hive表中 - MapReduce服务 MRS

配置HDFS Mover命令迁移数据 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

Loader基本原理 - MapReduce服务 MRS

概述 - MapReduce服务 MRS

配置HDFS单目录文件数量 - MapReduce服务 MRS

配置Hive表不同分区分别存储至OBS和HDFS - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

CALL - MapReduce服务 MRS

样例：通过Loader将数据从OBS导入HDFS - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线