搜索_华为云

数据导入 - MapReduce服务 MRS
数据导入 - MapReduce服务 MRS

数据导入概述使用Loader导入数据典型场景：从SFTP服务器导入数据到HDFS/OBS 典型场景：从SFTP服务器导入数据到HBase 典型场景：从SFTP服务器导入数据到Hive 典型场景：从FTP服务器导入数据到HBase 典型场景：从关系型数据库导入数据到HDFS/OBS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
数据写入 - MapReduce服务 MRS
数据写入 - MapReduce服务 MRS

数据写入写入更新数据时报错 Parquet/Avro schema 写入更新数据时报错UnsupportedOperationException 写入更新数据时报错SchemaCompatabilityException Hudi在upsert时占用了临时文件夹中大量空间 Hudi写入小精度Decimal数据失败

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题
迁移Kafka节点内数据 - MapReduce服务 MRS

迁移Kafka节点内数据操作场景用户可以根据业务需求，通过Kafka客户端命令，在不停止服务的情况下，进行节点内磁盘间的分区数据迁移。也可以通过KafkaUI进行分区迁移。前提条件 MRS集群管理员已明确业务需求，并准备一个Kafka用户（属于kafkaadmin组，普通模式不需要）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

CDM服务支持迁移的数据源可参考支持的数据源，数据源为Apache HDFS时，建议使用的版本为2.8.X、3.1.X，请执行搬迁前务必确认是否支持搬迁。方案架构 CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云HBase集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能有差

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

数据库临时表表名，用于临时保存传输过程中的数据，字段需要和“表名”配置的表一致。说明：使用临时表是为了使得导出数据到数据库时，不会在目的表中产生脏数据。只有在所有数据成功写入临时表后，才会将数据从临时表迁移到目的表。使用临时表会增加作业的执行时间。 tmp_test 单击“保存并运行”，开始保存并运行作业。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
使用Loader导出MRS集群内数据 - MapReduce服务 MRS

r算子帮助。转换步骤配置不正确时，传输的数据将无法转换并成为脏数据，脏数据标记规则如下：任意输入类型步骤中，原数据包含字段的个数小于配置字段的个数，或者原数据字段值与配置字段的类型不匹配时，全部数据成为脏数据。 “CSV文件输入”步骤中，“验证输入字段”检验输入字段与值的类型

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
配置Kafka数据均衡工具 - MapReduce服务 MRS

删除待移出的Partition所在的行（行结构为“Topic名称 Partition标识 Offset”，删除前先将该行数据保存，后续此内容还要添加到目的目录下的同名文件中）。修改目的数据目录下（例如：“${BIGDATA_DATA_HOME}/kafka/data2/kafka-logs”）

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka企业级能力增强
使用Loader导入数据至MRS集群 - MapReduce服务 MRS

表分区名，使用逗号分隔不同的分区。数据块分配方式指定数据切分后，如何分配。读取大小指定每次读取多大的数据量。 mysql-fastpath-connector 架构名称数据库模式名。表名数据库表名。查询条件指定表的查询条件。分区列名指定数据库表的一列，根据该列来划分要导入的数据，在map任务中用于分区。建议配置主键字段。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

图4 源端集群数据记录图5 目的端集群数据记录（可选）如果源端集群中有新增数据需要定期将新增数据迁移至目的端集群，则根据数据新增方式进行不同方式的迁移。配置定期任务增量迁移数据，直到所有业务迁移至目的端集群。 Hive表数据修改、未新增删除表、未修改已有表的数据结构：此时Hi

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

设置在磁盘数据均衡中可容忍的两磁盘之间的数据密度阈值差。如果任意两个磁盘数据密度差值的绝对值超过了此阈值，意味着对应的磁盘应该进行数据均衡。取值范围[1-100]。 10 dfs.disk.balancer.top.nodes.number 该参数用来指定集群中需要执行磁盘数据均衡的Top

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。 CDM服务迁移MySQL数据至MRS集群方案如图2所示。图2 MySQL数据迁移示意前提条件已经购买包含有Hive服务的MRS集群。已获取连接MySQL数据库的IP地

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
均衡Kafka扩容节点后数据 - MapReduce服务 MRS

均衡Kafka扩容节点后数据操作场景用户可以在Kafka扩容节点后，在客户端中执行Kafka均衡工具来均衡Kafka集群的负载。本章节内容适用于MRS 3.x之前版本。3.x及之后版本请参考配置Kafka数据均衡工具。前提条件 MRS集群管理员已明确业务需求，并准备一个K

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
数据复制 - MapReduce服务 MRS
数据复制 - MapReduce服务 MRS

数据快递服务（DES）对于TB或PB级数据上云的场景，华为云提供数据快递服务 DES。将线下集群数据及已导出的元数据复制到DES盒子，快递服务将数据递送到华为云机房，然后通过云数据迁移 CDM将DES盒子数据复制到HDFS。父主题：数据迁移方案介绍

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移 > 数据迁移方案介绍
Loader算子数据处理规则 - MapReduce服务 MRS

列数，全部数据成为脏数据。配置转换字段类型，与原始数据实际类型不同，全部数据成为脏数据。例如将字符串类型转换为数值类型。 HBase输入原始数据包含NULL值，不做转换处理。配置HBase表名错误，全部数据成为脏数据。 “主键”没有配置主键列，全部数据成为脏数据。配置输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
数据保护技术 - MapReduce服务 MRS

数据保护技术数据完整性通过数据校验，保证数据在存储、传输过程中的数据完整性。 MRS的用户数据保存在HDFS中，HDFS默认采用CRC32C算法校验数据的正确性，同时也支持CRC32校验算法，CRC32C校验速度快于CRC32。HDFS的DataNode节点负责存储校验数据，

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
写入OpenTSDB数据 - MapReduce服务 MRS

写入OpenTSDB数据功能简介使用OpenTSDB的接口(/api/put)写入数据。函数genWeatherData()模拟生成的气象数据，函数putData()发送气象数据到OpenTSDB服务端。样例代码以下代码片段在com.huawei.bigdata.opentsdb

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > 开发OpenTSDB应用
加载Impala数据 - MapReduce服务 MRS

加载Impala数据功能简介本小节介绍了如何使用Impala SQL向已有的表employees_info中加载数据。从本节中可以掌握如何从集群中加载数据。样例代码 -- 从本地文件系统/opt/impala_examples_data/目录下将employee_info.

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
加载Impala数据 - MapReduce服务 MRS

加载Impala数据功能简介本小节介绍了如何使用Impala SQL向已有的表employees_info中加载数据。从本节中可以掌握如何从集群中加载数据。样例代码 -- 从本地文件系统/opt/impala_examples_data/目录下将employee_info.

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
加载Impala数据 - MapReduce服务 MRS

加载Impala数据功能简介本小节介绍了如何使用Impala SQL向已有的表employees_info中加载数据。从本节中可以掌握如何从集群中加载数据。样例代码 -- 从本地文件系统/opt/impala_examples_data/目录下将employee_info.

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用

总条数： 3643

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据导入 - MapReduce服务 MRS

数据写入 - MapReduce服务 MRS

迁移Kafka节点内数据 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移HBase数据至MRS集群 - MapReduce服务 MRS

使用Loader从Hive导出数据到关系型数据库 - MapReduce服务 MRS

使用Loader导出MRS集群内数据 - MapReduce服务 MRS

配置Kafka数据均衡工具 - MapReduce服务 MRS

使用Loader导入数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

配置HDFS DiskBalancer磁盘均衡 - MapReduce服务 MRS

使用CDM服务迁移MySQL数据至MRS Hive - MapReduce服务 MRS

均衡Kafka扩容节点后数据 - MapReduce服务 MRS

数据复制 - MapReduce服务 MRS

Loader算子数据处理规则 - MapReduce服务 MRS

数据保护技术 - MapReduce服务 MRS

写入OpenTSDB数据 - MapReduce服务 MRS

加载Impala数据 - MapReduce服务 MRS

加载Impala数据 - MapReduce服务 MRS

加载Impala数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线