搜索_华为云

约束与限制 - 云数据迁移 CDM
约束与限制 - 云数据迁移 CDM

DWS主键或表只有一个字段时，要求字段类型必须是如下常用的字符串、数值、日期类型。从其他数据库迁移到DWS时，如果选择自动建表，主键必须为以下类型，未设置主键的情况下至少要有一个字段是以下类型，否则会无法创建表导致CDM作业失败。 INTEGER TYPES：TINYINT，SMALLINT

帮助中心 > 云数据迁移 CDM > 产品介绍
管理集群标签 - 云数据迁移 CDM

Studio服务进入数据集成界面可以看到。单击集群名称后，选择“标签”页签。图2 修改集群配置单击“添加/编辑标签”，通过添加、修改标签为CDM集群设置资源标识。图3 添加标签一个集群最多可添加10个标签。标签键（key）的最大长度为36个字符，标签值（value）的最大长度为43个字符。

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

id&gid&name”。 toJobConfig.shouldClearTable 否 Boolean 导入前是否清空目标表的数据，如果设置为true，任务启动前会清除目标表中数据。父主题：目的端作业参数说明

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为DIS - 云数据迁移 CDM
源端为DIS - 云数据迁移 CDM

fromJobConfig.streamName 是 String DIS的通道名。 fromJobConfig.disConsumerStrategy 是枚举设置从DIS拉取数据时的初始偏移量： LATEST：最大偏移量，即最新的数据。 FROM_LAST_STOP：从上次停止处继续拉取。 EARLIEST：最小偏移量，即最早的数据。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
文件格式介绍 - 云数据迁移 CDM

启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
文件格式介绍 - 云数据迁移 CDM

启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以设置超时时间，在超时时间内，CDM会周期去查询标识文件是否存在，超时后标识文件还不存在的话，则作业任务失败。启动作业标识文件本身不会被迁移。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
源端为HBase/CloudTable - 云数据迁移 CDM

选择是否拆分Rowkey，例如“true”。 fromJobConfig.delimiter 否 String 用于切分Rowkey的分隔符，若不设置则不切分，例如“|”。 fromJobConfig.startTime 否 String 时间区间左边界（包含该值），格式为“yyyy-MM-dd

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
创建CDM与数据源之间的连接 - 云数据迁移 CDM

创建CDM与数据源之间的连接操作场景用户在创建数据迁移的任务前，需要先创建连接，让CDM集群能够读写数据源。一个迁移任务，需要建立两个连接，源连接和目的连接。不同的迁移方式（表或者文件迁移），哪些数据源支持导出（即作为源连接），哪些数据源支持导入（即作为目的连接），详情请参见支持的数据源。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
CDM作业配置管理 - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
创建CDM集群 - 云数据迁移 CDM
创建CDM集群 - 云数据迁移 CDM

创建CDM集群操作场景目前CDM采用独立集群的方式为用户提供安全可靠的数据迁移服务，各集群之间相互隔离，不可相互访问。目前一个集群只支持一个服务器。前提条件已申请VPC、子网和安全组。CDM集群连接云上其它服务时，需确保CDM集群与待连接的云服务在同一个VPC。如果CDM

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
应用示例 - 云数据迁移 CDM
应用示例 - 云数据迁移 CDM

user_dws 密码访问DWS数据库的用户密码。 dws_password 获取token 调用其他API前，需要获取token，并设置成环境变量。 curl -H "Content-Type:application/json" https://{iam_endpoint}/v3/auth/tokens

帮助中心 > 云数据迁移 CDM > API参考
新建Hadoop集群配置 - 云数据迁移 CDM

获取下载的tar包，此即为FusionInsight集群Keytab文件。针对MRS 2.x及之前版本集群：登录MRS服务的Manager，单击“系统设置”。在“权限配置”区域，单击“用户管理”。在需导出keytab文件用户所在的行，选择“更多 > 下载认证凭据”下载认证文件，待文件自动生成后指定保存位置，并妥善保管该文件。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接
HBase连接参数说明 - 云数据迁移 CDM

HBase连接参数说明目前CDM支持连接的HBase数据源有以下几种： MRS HBase FusionInsight HBase Apache HBase 作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。 MRS HBase

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
HDFS连接参数说明 - 云数据迁移 CDM

HDFS连接参数说明目前CDM支持连接的HDFS数据源有以下几种： MRS HDFS FusionInsight HDFS Apache HDFS 作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。 MRS HDFS 连

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建连接 > 配置连接参数
配置HBase/CloudTable源端参数 - 云数据迁移 CDM

切分Rowkey 可选参数，选择是否拆分Rowkey，默认为“否”。是 Rowkey分隔符可选参数，用于拆分Rowkey的分隔符，若不设置则不切分。 | 起始时间可选参数，起始时间（包含该值），格式为“yyyy-MM-dd HH:mm:ss”，表示只抽取该时间及以后的数据。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
新建整库迁移作业 - 云数据迁移 CDM

、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 单击“保存”，或者“保存并运行”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
什么是云数据迁移 - 云数据迁移 CDM

脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符合清洗规则的数据单独归档到脏数据日志中，便于用户查看。并支持设置脏数据比例阈值，来决定任务是否成功。

帮助中心 > 云数据迁移 CDM > 产品介绍
新增字段操作指导 - 云数据迁移 CDM

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
配置Hive源端参数 - 云数据迁移 CDM

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 109

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

约束与限制 - 云数据迁移 CDM

管理集群标签 - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

源端为DIS - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

文件格式介绍 - 云数据迁移 CDM

源端为HBase/CloudTable - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

创建CDM与数据源之间的连接 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

创建CDM集群 - 云数据迁移 CDM

应用示例 - 云数据迁移 CDM

新建Hadoop集群配置 - 云数据迁移 CDM

HBase连接参数说明 - 云数据迁移 CDM

HDFS连接参数说明 - 云数据迁移 CDM

配置HBase/CloudTable源端参数 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

什么是云数据迁移 - 云数据迁移 CDM

新增字段操作指导 - 云数据迁移 CDM

配置Hive源端参数 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线