搜索_华为云

数据源为Hive时支持哪些数据格式？ - 云数据迁移 CDM

数据源为Hive时支持哪些数据格式？问题描述云数据迁移服务，数据源为Hive时支持的数据格式有哪些？解决方案云数据迁移服务支持从Hive数据源读写的数据格式包括SequenceFile、TextFile、ORC、Parquet。父主题：功能类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
概述 - 云数据迁移 CDM
概述 - 云数据迁移 CDM

批量数据迁移服务，帮助您实现数据自由流动。支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。您可以使用本文档提供的API对云数据迁移服务进行操作，如创建集群、创建迁移任务等，支持的全部操作请参见API概览。在调用云数据迁移服务API之

 帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。先删除后创建：CDM先删除“表名”参数中指定的表，然后再重新创建该表。不自动创建表名写入数据的目标表名，单击输入框后面的按钮可进入表的选择界面。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为HTTP/HTTPS - 云数据迁移 CDM

该参数设置为“true”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“false”时，上传到OBS的对象使用的对象名，包含query参数。 fromJobConfig.md5FileSuffix 否 String 校验CDM抽取的文件，是否与源文件一致。父主题：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为关系数据库 - 云数据迁移 CDM

入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为关系数据库 - 云数据迁移 CDM

表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table*表示导出所有以“table”开头的表。 *table表示导出所有以“table”结尾的表。 *table*表示表名中只要有“table”字符串，就全部导出。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

写入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？问题描述 Hive迁移作业长时间卡顿怎么办？解决方案为避免Hive迁移作业长时间卡顿，可手动停止迁移作业后，通过编辑Hive连接增加如下属性设置：属性名称：hive.server2.idle.operation.timeout 值：10m 如图所示：父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
操作流程概述 - 云数据迁移 CDM

使用CDM+OBS+DLI进行贸易统计分析的操作过程主要包括2个步骤：使用CDM上传数据到OBS 通过CDM将H公司存量数据上传到对象存储服务OBS。通过CDM作业的定时任务，每天自动上传增量数据到OBS。使用DLI分析数据通过DLI直接分析OBS中的业务数据，支撑H公司客户进行贸易统计分析。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 贸易数据极简上云与统计分析
源端为对象存储 - 云数据迁移 CDM

CDM会将CSV文件的第一行数据作为标题行，不写入目的端的表。 fromJobConfig.fromCompression 否枚举压缩格式，当文件格式为“CSV_FILE”或“JSON”时此参数有效。选择对应压缩格式的源文件： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为DLI - 云数据迁移 CDM
目的端为DLI - 云数据迁移 CDM

写入数据的资源队列。 toJobConfig.database 是 String 写入数据到数据湖探索（DLI）的哪个数据库。 toJobConfig.table 是 String 写入数据的表名。 toJobConfig.columnList 否 String 需要加载的字段列表

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

encryption”（加密方式）选择“AES-256-GCM”时有该参数，密钥由长度64的十六进制数组成。请您牢记这里配置的密钥，解密时的密钥与这里配置的必须一致。如果不一致系统不会报异常，只是解密出来的数据会错误。 toJobConfig.iv 否 String 初始化向量，“toJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为Hive - 云数据迁移 CDM
源端为Hive - 云数据迁移 CDM

String 待抽取数据的数据源，作业源端为Hive时，这里为“hive”。 fromJobConfig.database 否 String 待抽取数据的数据库，例如“default”。 fromJobConfig.table 是 String 待抽取数据的表名，例如“cdm”。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency 是 Boolean 是否永久运行。 fromJobConfig.groupId 否 String 用户指定消费组ID。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为DDS - 云数据迁移 CDM
目的端为DDS - 云数据迁移 CDM

database 是 String MongoDB/DDS的数据库名称 toJobConfig.collectionName 是 String MongoDB/DDS的集合名称。 toJobConfig.columnList 否 String 需要抽取的字段列表，字段名之间使用“&”分割，例如：“id&gid&name”。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
车联网大数据零丢失搬迁入湖 - 云数据迁移 CDM

车联网大数据零丢失搬迁入湖车联网大数搬迁入湖简介场景介绍迁移准备 CDM迁移近一个月的数据 DES迁移一个月前的历史数据 MRS中恢复HBase表

 帮助中心 > 云数据迁移 CDM > 最佳实践
指定文件名迁移 - 云数据迁移 CDM

从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（最多50个）

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
OBS导入数据到SQL Server时出现Unable to execute the SQL statement怎么处理？ - 云数据迁移 CDM

statement. Cause : 将截断字符串或二进制数据。原因分析用户OBS中的数据超出了SQL Server数据库的字段长度限制。解决方案在SQL Server数据库中建表时，将数据库字段改大，长度不能小于源端OBS中的数据长度。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
增量迁移原理介绍 - 云数据迁移 CDM

增量迁移原理介绍文件增量迁移关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移父主题：进阶实践

 帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践

总条数： 376

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据源为Hive时支持哪些数据格式？ - 云数据迁移 CDM

概述 - 云数据迁移 CDM

配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

目的端为关系数据库 - 云数据迁移 CDM

源端为关系数据库 - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

Hive迁移作业长时间卡顿怎么办？ - 云数据迁移 CDM

操作流程概述 - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

目的端为DLI - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

源端为Hive - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

目的端为DDS - 云数据迁移 CDM

车联网大数据零丢失搬迁入湖 - 云数据迁移 CDM

指定文件名迁移 - 云数据迁移 CDM

OBS导入数据到SQL Server时出现Unable to execute the SQL statement怎么处理？ - 云数据迁移 CDM

增量迁移原理介绍 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线