搜索_华为云

作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

添加字段，因为MongoDB是文档数据库，没有scheme概念。CDM字段映射取的是第一条的json key。CDM支持combine()函数，可以把非公共的列封装为一个列。解决方案使用MongoDB Reader插件读出数据时，combine()支持合并MongoDB docum

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
源端为Kafka - 云数据迁移 CDM
源端为Kafka - 云数据迁移 CDM

} 参数说明参数是否必选类型说明 fromJobConfig.topicsList 是 String Kafka topic列表，可以为多个topic，以“,”作为分隔符。 fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置：

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为对象存储 - 云数据迁移 CDM

fromJobConfig.inputDirectory 是 String 抽取文件的路径。支持输入多个文件路径（最多50个），默认以“|”分隔，也可以自定义文件分隔符，例如：“FROM/example.csv|FROM/b.txt”。 fromJobConfig.inputFormat 是

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
迁移到DWS时出现value too long for type character varying怎么处理？ - 云数据迁移 CDM

char的长度时，就会出现错误：value too long for type character varying。解决方案这个问题，可以通过将目的端作业参数“扩大字符字段长度”选择“是”来解决，选择此选项后，再创建目的表时会自动将varchar类型的字段长度扩大3倍。编辑

 帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
项目ID和账号ID - 云数据迁移 CDM

在“API凭证”页面，查看账号名和账号ID、IAM用户名和IAM用户ID，在项目列表中查看项目和项目ID。调用API获取项目ID 项目ID可以通过调用查询指定条件下的项目信息API获取，接口为“GET https://{Endpoint}/v3/projects”，其中{Endp

帮助中心 > 云数据迁移 CDM > API参考 > 使用前必读
CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端

 帮助中心 > 云数据迁移 CDM > 常见问题 > 通用类
CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

ht LibrA的运行非常重要，在CDM数据迁移到DWS/FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
CDM迁移作业的抽取并发数应该如何设置？ - 云数据迁移 CDM

集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端

 帮助中心 > 云数据迁移 CDM > 常见问题 > 功能类
源端为HDFS - 云数据迁移 CDM
源端为HDFS - 云数据迁移 CDM

”分隔，例如：“*.csv,*.txt”。 fromJobConfig.startTime 否 String “过滤类型”选择“时间过滤器”时，可以指定一个时间值，当文件的修改时间大于等于该时间才会被传输，输入的时间格式需为“yyyy-MM-dd HH:mm:ss”。该参数支持配置为

 帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
源端为Redis - 云数据迁移 CDM
源端为Redis - 云数据迁移 CDM

关系表行数据在Redis中的存储方式分为“string”和“hash”两种存储方式。 STRING：表示用字符串通过分隔符来表示一行数据的各列，可以有效节省存储空间。 HASH：表示一行数据通过“列名：列值”的方式存储在hash表中。 fromJobConfig.valueSeparator

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 源端作业参数说明
MD5校验文件一致性 - 云数据迁移 CDM

该功能由目的端作业参数“校验MD5值”控制，读取文件后写入OBS时，通过HTTP Header将MD5值提供给OBS做写入校验，并将校验结果写入OBS桶（该桶可以不是存储迁移文件的桶）。如果源端没有MD5文件则不校验。迁移文件到文件系统时，目前只支持校验CDM抽取的文件是否与源文件一致（即只校验抽取的数据）。

帮助中心 > 云数据迁移 CDM > 最佳实践 > 进阶实践
字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

每条数据的列数不固定，在字段映射界面CDM通过获取样值的方式有较大概率无法获得所有列，此时作业执行完后会造成目的端的数据不全。这个问题，可以通过以下方法解决：在CDM的字段映射界面增加字段。在CDM的作业管理界面直接编辑作业的JSON（修改“fromJobConfig.columns”、“toJobConfig

帮助中心 > 云数据迁移 CDM > 常见问题 > 故障处理类
目的端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

例如：“id&gid&name”。 toJobConfig.pipeLine 否 String 需要先在kibana中创建管道ID，这里才可以选择，该参数用于数据传到云搜索服务/Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。

帮助中心 > 云数据迁移 CDM > API参考 > 公共数据结构 > 目的端作业参数说明
MD5校验文件一致性 - 云数据迁移 CDM

该功能由目的端作业参数“校验MD5值”控制，读取文件后写入OBS时，通过HTTP Header将MD5值提供给OBS做写入校验，并将校验结果写入OBS桶（该桶可以不是存储迁移文件的桶）。如果源端没有MD5文件则不校验。迁移文件到文件系统时，目前只支持校验CDM抽取的文件是否与源文件一致（即只校验抽取的数据）。

帮助中心 > 云数据迁移 CDM > 用户指南 > 关键操作指导

总条数： 314

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

作业配置添加字段，MongoDB字段映射存在问题 - 云数据迁移 CDM

源端为Kafka - 云数据迁移 CDM

源端为对象存储 - 云数据迁移 CDM

迁移到DWS时出现value too long for type character varying怎么处理？ - 云数据迁移 CDM

项目ID和账号ID - 云数据迁移 CDM

CDM不同集群规格对应并发的作业数是多少？ - 云数据迁移 CDM

CDM迁移数据到DWS时如何选取分布列？ - 云数据迁移 CDM

CDM迁移作业的抽取并发数应该如何设置？ - 云数据迁移 CDM

源端为HDFS - 云数据迁移 CDM

源端为Redis - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

字段映射界面无法显示所有列怎么处理？ - 云数据迁移 CDM

目的端为Elasticsearch/云搜索服务 - 云数据迁移 CDM

MD5校验文件一致性 - 云数据迁移 CDM

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线