搜索_华为云

权限及授权项说明 - 云数据迁移 CDM

Management，简称IAM）。如果云账号已经能满足您的要求，不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用CDM服务。默认情况下，新建的IAM用户没有任何权限，您需要将其加入用户组，并给用户组授予策略或角色，才能使用户组中的用户获得相应的权限，这一过程称为授权。授权后，用户就可以基于已有权限对云服务进行操作。

帮助中心 > 云数据迁移 CDM > API参考
创建集群 - 云数据迁移 CDM
创建集群 - 云数据迁移 CDM

CLOUD_SDK_SK in the local environment String ak = System.getenv("CLOUD_SDK_AK"); String sk = System.getenv("CLOUD_SDK_SK");

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
新建Hadoop集群配置 - 云数据迁移 CDM

已参见表1获取相应Hadoop集群配置文件和Keytab文件。获取集群配置文件和Keytab文件不同Hadoop类型的集群配置文件和Keytab文件获取方式有所不同，请参见表1获取相应Hadoop集群配置文件和Keytab文件。表1 集群配置文件和Keytab文件获取方式 Hadoop类型连接

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
配置OBS目的端参数 - 云数据迁移 CDM

directory/ 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
查询所有集群的企业项目ID - 云数据迁移 CDM

The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and

帮助中心 > 云数据迁移 CDM > API参考 > API > 集群管理
通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

对min 运算无效。图1 报错信息故障分析客户作业中配置的并发数大于1，CDM会选择分区列进行分区迁移，默认情况：取主键字段，如果没有主键字段取的是从元数据里面的第一个字段作为分区字段。由于客户作业中设置的并发数是8，程序选择IsDef作为分区字段，但是IsDef的类型是bit，不支持min运算所以会报错。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
关系数据库连接 - 云数据迁移 CDM

DATA功能加快数据导入，提高导入数据到MySQL数据库的性能。说明： REPLACE 和 IGNORE 修饰符用于处理与现有行具有相同唯一键值（PRIMARY KEY或UNIQUE索引值）的新输入的行。约束冲突处理配置为"replace into"或"local"，使用REPLACE，与现有行中的唯一键值具有相同值的新行将替换现有行。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 连接参数说明
配置FTP/SFTP源端参数 - 云数据迁移 CDM

置。是文件分隔符 “源目录或文件”参数中如果输入的是多个文件路径，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 | 标识文件名选择开启作业标识文件的功能时，需要指定启动作业的标识文件名。指定文件后，只有在源端路径下存在该文件的情况下才会运行任务。该文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为对象存储 - 云数据迁移 CDM

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
DMS Kafka连接参数说明 - 云数据迁移 CDM

群IP查找对应的ECS主机）中的“/etc/hosts”文件，为其添加Broker连接地址的自映射，以便客户端能够快速解析实例的Broker。例如Kafka Broker地址配置为10.154.48.120时，hosts文件中的自映射配置为： 10.154.48.120 10.154

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
源端为HTTP/HTTPS - 云数据迁移 CDM

String 需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 fromJobConfig.fileSeparator 否 String 传输多个文件时，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
目的端为HDFS - 云数据迁移 CDM
目的端为HDFS - 云数据迁移 CDM

将二进制文件先写入到临时文件（临时文件以“.tmp”作为后缀），迁移成功后，再进行rename或move操作，在目的端恢复文件。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
查询作业状态 - 云数据迁移 CDM

Integer 总文件数。 ROWS_READ Long 读取的行数。 BYTES_READ Long 读取的字节数。 ROWS_WRITTEN Long 写入的行数。 FILES_WRITTEN Integer 写入的文件数。 FILES_READ Integer 读取的文件数。 TOTAL_SIZE

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
查询作业执行历史 - 云数据迁移 CDM

Integer 总文件数。 ROWS_READ Long 读取的行数。 BYTES_READ Long 读取的字节数。 ROWS_WRITTEN Long 写入的行数。 FILES_WRITTEN Integer 写入的文件数。 FILES_READ Integer 读取的文件数。 TOTAL_SIZE

帮助中心 > 云数据迁移 CDM > API参考 > API > 作业管理
步骤3：创建并执行作业 - 云数据迁移 CDM

导入到DWS时需要手动选择DWS的分布列，建议按如下顺序选取：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如果需要转换源端字段内容，可在该步骤配置，详细请参见字段转换，这里选择不进行字段转换。

帮助中心 > 云数据迁移 CDM > 快速入门
配置Hive目的端参数 - 云数据迁移 CDM

选择Hive表清理数据模式。 LOAD_OVERWRITE模式：将生成一个临时数据文件目录，使用Hive的load overwrite语法将临时目录加载到Hive表中。 TRUCATE模式：只清理分区下的数据文件，不删除分区。说明：目的端为分区表时，Hive表清理数据模式建议设置为L

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
进阶实践 - 云数据迁移 CDM
进阶实践 - 云数据迁移 CDM

进阶实践增量迁移原理介绍时间宏变量使用解析事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍

 帮助中心 > 云数据迁移 CDM > 最佳实践
参考：作业分片维度 - 云数据迁移 CDM

JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 PostgreSQL

帮助中心 > 云数据迁移 CDM > 性能白皮书
配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

自动创表只有当源端为关系数据库时，才有该参数。表示写入表数据时，用户选择的操作：不自动创建：不自动建表。不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。先删除后创建：CDM先

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业目的端参数

总条数： 260

上一页
1
...
6
7
8
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

权限及授权项说明 - 云数据迁移 CDM

创建集群 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

配置OBS目的端参数 - 云数据迁移 CDM

查询所有集群的企业项目ID - 云数据迁移 CDM

通过json方式导入的作业，sql server迁移到hive，执行作业报错 - 云数据迁移 CDM

关系数据库连接 - 云数据迁移 CDM

配置FTP/SFTP源端参数 - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

DMS Kafka连接参数说明 - 云数据迁移 CDM

源端为HTTP/HTTPS - 云数据迁移 CDM

目的端为HDFS - 云数据迁移 CDM

查询作业状态 - 云数据迁移 CDM

查询作业执行历史 - 云数据迁移 CDM

步骤3：创建并执行作业 - 云数据迁移 CDM

配置Hive目的端参数 - 云数据迁移 CDM

进阶实践 - 云数据迁移 CDM

参考：作业分片维度 - 云数据迁移 CDM

配置MySQL/SQL Server/PostgreSQL目的端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线