搜索_华为云

添加HetuEngine数据源 - MapReduce服务 MRS

添加HetuEngine数据源使用HetuEngine跨源跨域访问数据源添加Hive数据源添加Hudi数据源添加ClickHouse数据源添加GAUSSDB数据源添加HBase数据源添加跨集群HetuEngine数据源添加IoTDB数据源添加MySQL数据源父主题：使用HetuEngine

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
MRS集群元数据概述 - MapReduce服务 MRS

MRS集群元数据概述 MRS的数据连接用于管理集群中组件使用的外部源连接，如Hive的元数据可以通过数据连接关联使用外部的关系型数据库。本地元数据：元数据存储于集群内的本地GaussDB中，当集群删除时元数据同时被删除，如需保存元数据，需提前前往数据库手动保存元数据。外置数据连接：

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
Loader算子数据处理规则 - MapReduce服务 MRS

列数，全部数据成为脏数据。配置转换字段类型，与原始数据实际类型不同，全部数据成为脏数据。例如将字符串类型转换为数值类型。 HBase输入原始数据包含NULL值，不做转换处理。配置HBase表名错误，全部数据成为脏数据。 “主键”没有配置主键列，全部数据成为脏数据。配置输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
数据迁移到MRS前网络准备 - MapReduce服务 MRS

客户线下数据中心迁移数据到华为云MRS集群，通过云专线服务为用户搭建本地数据中心与云上VPC之间的专属连接通道。可以使用华为云的云专线服务或使用第三方的云专线服务来连通华为云网络。图1 线下数据中心迁移客户在华为云上自建大数据集群（或老版本的MRS集群）需要迁移到华为云MRS集群，且在

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
MapReduce与其他组件的关系 - MapReduce服务 MRS

价格低廉的硬件上，存储应用程序的数据，适合有超大数据集的应用程序。 MapReduce是一种编程模型，用于大数据集（大于1TB）的并行运算。在MapReduce程序中计算的数据可以来自多个数据源，如Local FileSystem、HDFS、数据库等。最常用的是HDFS，利用HD

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
Hive ORC数据存储优化 - MapReduce服务 MRS

Hive ORC数据存储优化操作场景 “ORC”是一种高效的列存储格式，在压缩比和读取效率上优于其他文件格式。建议使用“ORC”作为Hive表默认的存储格式。前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。 CDM服务迁移MySQL数据至MRS集群方案如图2所示。图2 MySQL数据迁移示意前提条件已经购买包含有Hive服务的MRS集群。已获取连接MySQL数据库的IP地

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

的多个任务对同一个数据集进行计算时的IO瓶颈。Spark利用Scala语言实现，Scala能够使得处理分布式数据集时，能够像处理本地化数据一样。除了交互式的数据分析，Spark还能够支持交互式的数据挖掘，由于Spark是基于内存的计算，很方便处理迭代计算，而数据挖掘的问题通常都是

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hadoop集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

字段将显示为空，在回显状态下需要将密码信息补齐后再提交作业。表1 FlinkSQL与ClickHouse数据类型对应关系 FlinkSQL数据类型 ClickHouse数据类型 BOOLEAN UInt8 TINYINT Int8 SMALLINT Int16 INTEGER Int32

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群操作场景本入门提供从零开始创建HBase查询集群并通过集群客户端进行HBase表的创建与查询操作指导。 HBase集群使用Hadoop和HBase组件提供一个稳定可靠、性能优异、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用

 帮助中心 > MapReduce服务 MRS > 快速入门
数据存储在OBS和HDFS有什么区别？ - MapReduce服务 MRS

限制，并且集群可以随时删除，但计算性能取决于OBS访问性能，相对HDFS有所下降，建议在数据计算不频繁场景下使用。数据存储在HDFS：数据存储和计算不分离，集群成本较高，计算性能高，但存储量受磁盘空间限制，删除集群前需将数据导出保存，建议在数据计算频繁场景下使用。父主题：产品咨询类

 帮助中心 > MapReduce服务 MRS > 常见问题 > 产品咨询类
数据导出 - MapReduce服务 MRS
数据导出 - MapReduce服务 MRS

数据导出概述使用Loader导出数据典型场景：从HDFS/OBS导出数据到SFTP服务器典型场景：从HBase导出数据到SFTP服务器典型场景：从Hive导出数据到SFTP服务器典型场景：从HDFS/OBS导出数据到关系型数据库典型场景：从HBase导出数据到关系型数据库

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
查询Impala数据 - MapReduce服务 MRS

查询Impala数据功能简介本小节介绍了如何使用Impala SQL对数据进行查询分析。从本节中可以掌握如下查询分析方法。 SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Impala自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见开发Impala用户自定义函数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
数据导入 - MapReduce服务 MRS
数据导入 - MapReduce服务 MRS

数据导入概述使用Loader导入数据典型场景：从SFTP服务器导入数据到HDFS/OBS 典型场景：从SFTP服务器导入数据到HBase 典型场景：从SFTP服务器导入数据到Hive 典型场景：从FTP服务器导入数据到HBase 典型场景：从关系型数据库导入数据到HDFS/OBS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
数据写入 - MapReduce服务 MRS
数据写入 - MapReduce服务 MRS

数据写入写入更新数据时报错 Parquet/Avro schema 写入更新数据时报错UnsupportedOperationException 写入更新数据时报错SchemaCompatabilityException Hudi在upsert时占用了临时文件夹中大量空间 Hudi写入小精度Decimal数据失败

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题
自定义购买MRS集群 - MapReduce服务 MRS

请根据业务需求合理选择需要的组件，部分类型集群创建后不支持添加服务。 - 元数据是否使用外部数据源存储集群的Hive、Ranger元数据。本地元数据：元数据存储在集群本地。外置数据连接：使用外部数据源元数据，若集群异常或删除时将不影响元数据，适用于存储计算分离的场景。在创建MRS集群时，支持对接La

帮助中心 > MapReduce服务 MRS > 用户指南 > 购买MRS集群
使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive Query Language语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
产品优势 - MapReduce服务 MRS
产品优势 - MapReduce服务 MRS

MRS具有开放的生态，支持无缝对接周边服务，快速构建统一大数据平台。以全栈大数据MRS服务为基础，企业可以一键式构筑数据接入、数据存储、数据分析和价值挖掘的统一大数据平台，并且与数据治理中心DataArts Studio及数据可视化等服务对接，为客户轻松解决数据通道上云、大数据作业开发调度和数据展现的困难，使客户从

 帮助中心 > MapReduce服务 MRS > 产品介绍
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hive集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。使用华为云CDM服务“场景迁移功能”可以一键式便捷地完成Hive数据的迁移。本章节以通过华为云CDM服务 2

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移

总条数： 4144

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

添加HetuEngine数据源 - MapReduce服务 MRS

MRS集群元数据概述 - MapReduce服务 MRS

Loader算子数据处理规则 - MapReduce服务 MRS

数据迁移到MRS前网络准备 - MapReduce服务 MRS

MapReduce与其他组件的关系 - MapReduce服务 MRS

Hive ORC数据存储优化 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

创建FlinkServer作业写入数据至ClickHouse表 - MapReduce服务 MRS

快速创建和使用HBase离线数据查询集群 - MapReduce服务 MRS

数据存储在OBS和HDFS有什么区别？ - MapReduce服务 MRS

数据导出 - MapReduce服务 MRS

查询Impala数据 - MapReduce服务 MRS

数据导入 - MapReduce服务 MRS

数据写入 - MapReduce服务 MRS

自定义购买MRS集群 - MapReduce服务 MRS

使用Hive加载OBS数据并分析企业雇员信息 - MapReduce服务 MRS

产品优势 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线