搜索_华为云

支持的数据类型 - 云数据迁移 CDM

不能使用无符号的双精度浮点数。可以定义显示长度（M）和小数位数（D）。这不是必需的，默认为16，4，其中4是小数的位数。小数精度可以达到53位的DOUBLE。 REAL是DOUBLE同义词。 52.36 DOUBLE FLOAT8 DOUBLE PRECISION 与DOUBLE相似。

帮助中心 > 云数据迁移 CDM > 用户指南 > 支持的数据源
配置Redis源端参数 - 云数据迁移 CDM

配置Redis源端参数第三方云的Redis服务无法支持作为源端。如果是用户在本地数据中心或ECS上自行搭建的Redis支持作为源端或目的端。作业中源连接为从本地Redis导出的数据时，源端作业参数如表1所示。表1 Redis作为源端时的作业参数参数类型参数名说明取值样例

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置HDFS源端参数 - 云数据迁移 CDM

传输数据时所用的文件格式，可选择以下文件格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
源端为FTP/SFTP - 云数据迁移 CDM
源端为FTP/SFTP - 云数据迁移 CDM

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
配置HTTP源端参数 - 云数据迁移 CDM

隔符来区分各个文件，默认为|。列表文件选择“是”时，不显示该参数。 | QUERY参数该参数设置为“是”时，上传到OBS的对象使用的对象名，为去掉query参数后的字符。该参数设置为“否”时，上传到OBS的对象使用的对象名，包含query参数。否忽略不存在原路径/文件如

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Elasticsearch/云搜索服务源端参数 - 云数据迁移 CDM

Elasticsearch分页查询，用来设置分页size的大小。 1000 ScrollId超时时间配置 Elasticsearch scroll查询时会记录一个scroll_id，超时或者scroll查询结束后会清除请求的srcoll_id，通过设置这个超时时间配置，来指定scroll_id超时时间。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业 > 配置CDM作业源端参数
功能类 - 云数据迁移 CDM
功能类 - 云数据迁移 CDM

API创建数据迁移作业？如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？在创建迁移作业时，where语句参数中的时间格式是怎样的？

帮助中心 > 云数据迁移 CDM > 常见问题
正则表达式分隔半结构化文本 - 云数据迁移 CDM

classpath.extra 正则表达式为： ^(\d.*\d) (\w*) \[(.*)\] (\w.*).* 解析出的结果如下：表1 Log4J日志解析结果列号样值 1 2018-01-11 08:50:59,001 2 INFO 3 org.apache.sqoop

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导
作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

查看CDM迁移作业，源端数据库表名全部为小写，但是迁移的表中是包含有大写字母，将所要迁移的表名跟数据库中保持一致，目的端字段就可以映射出来了，问题解决。解决方案在作业设置中，源端配置中迁移的数据库表名应按照数据库中的名称填写或者通过搜索选择表名，问题解决。父主题：故障处理类

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
正则表达式分隔半结构化文本 - 云数据迁移 CDM

classpath.extra 正则表达式为： ^(\d.*\d) (\w*) \[(.*)\] (\w.*).* 解析出的结果如下：表1 Log4J日志解析结果列号样值 1 2018-01-11 08:50:59,001 2 INFO 3 org.apache.sqoop

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
迁移MySql到DLI字段类型转换报错For input string："false"怎么处理？ - 云数据迁移 CDM

可通过以下两种方式解决问题：修改目的端建表语句，INT类型为BOOL类型；源端修改MySql参数，将该"mysql.bool.type.transform"参数设置为"false"。其中第二种方式可以在CDM的Mysql连接器高级属性中添加：连接管理-Mysql连接-高级属性-添加参数 mysql

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
目的端为OBS - 云数据迁移 CDM
目的端为OBS - 云数据迁移 CDM

写入数据时所用的文件格式（二进制除外），支持以下文件格式： CSV_FILE：按照CSV格式写入数据。 BINARY_FILE：二进制格式，不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式。当选择“BINARY_FILE”时，源端也必须为文件系统。 toJobConfig

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
管理集群标签 - 云数据迁移 CDM

Studio服务进入数据集成界面可以看到。单击集群名称后，选择“标签”页签。图2 修改集群配置单击“添加/编辑标签”，通过添加、修改标签为CDM集群设置资源标识。图3 添加标签一个集群最多可添加10个标签。标签键（key）的最大长度为36个字符，标签值（value）的最大长度为43个字符。

帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
目的端为Hive - 云数据迁移 CDM
目的端为Hive - 云数据迁移 CDM

id&gid&name”。 toJobConfig.shouldClearTable 否 Boolean 导入前是否清空目标表的数据，如果设置为true，任务启动前会清除目标表中数据。父主题：目的端作业参数说明

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
源端为HBase/CloudTable - 云数据迁移 CDM

选择是否拆分Rowkey，例如“true”。 fromJobConfig.delimiter 否 String 用于切分Rowkey的分隔符，若不设置则不切分，例如“|”。 fromJobConfig.startTime 否 String 时间区间左边界（包含该值），格式为“yyyy-MM-dd

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
作业任务参数说明 - 云数据迁移 CDM

作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批量删除作业、按组批量启动作业、按组导出等。是否定时执行：可选择作业是否定时自动启动。抽取并发数：可设置同时执行的抽取任务数。是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构
创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

创建Mysql链接，确认过用户名、密码没有错，同样的配置，在roma上建立数据连接能成功。故障分析查看后端日志，考虑用户Mysql侧有白名单限制，测试内网相通的另一台ECS Mysql客户端使用这个用户链接。解决方案再次核实账号密码无误，是用户使用Mysql账号没有给CDM集群授权，用户侧Mysql数据库需要对cdm集群的ip授权。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM作业配置管理 - 云数据迁移 CDM

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业
重启CDM集群 - 云数据迁移 CDM
重启CDM集群 - 云数据迁移 CDM

您可以选择重启CDM服务进程或重启集群VM，选择完成并单击确认后即可完成集群重启操作。重启CDM服务进程：只重启CDM服务的进程，不会重启集群虚拟机。重启集群VM：业务进程会中断，并重启集群的虚拟机。父主题：创建并管理CDM集群

 帮助中心 > 云数据迁移 CDM > 用户指南 > 创建并管理CDM集群
新建整库迁移作业 - 云数据迁移 CDM

、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 单击“保存”，或者“保存并运行”。

帮助中心 > 云数据迁移 CDM > 用户指南 > 在CDM集群中创建作业

总条数： 207

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

支持的数据类型 - 云数据迁移 CDM

配置Redis源端参数 - 云数据迁移 CDM

配置HDFS源端参数 - 云数据迁移 CDM

源端为FTP/SFTP - 云数据迁移 CDM

配置HTTP源端参数 - 云数据迁移 CDM

配置Elasticsearch/云搜索服务源端参数 - 云数据迁移 CDM

功能类 - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

作业配置表不存在时自动创建，目的端字段映射不出来怎么处理？ - 云数据迁移 CDM

正则表达式分隔半结构化文本 - 云数据迁移 CDM

迁移MySql到DLI字段类型转换报错For input string："false"怎么处理？ - 云数据迁移 CDM

目的端为OBS - 云数据迁移 CDM

管理集群标签 - 云数据迁移 CDM

目的端为Hive - 云数据迁移 CDM

源端为HBase/CloudTable - 云数据迁移 CDM

作业任务参数说明 - 云数据迁移 CDM

创建源数据连接，一直报错用户名和密码错误，但是实际填的没有错 - 云数据迁移 CDM

CDM作业配置管理 - 云数据迁移 CDM

重启CDM集群 - 云数据迁移 CDM

新建整库迁移作业 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线