搜索_华为云

数据迁移进阶实践 - 数据治理中心 DataArts Studio

数据迁移进阶实践增量迁移原理介绍时间宏变量使用解析事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业操作场景 CDM可以实现在同构、异构数据源之间进行表或文件级别的数据迁移，支持表/文件迁移的数据源请参见支持的数据源。约束限制记录脏数据功能依赖于OBS服务。作业导入时，JSON文件大小不超过1MB。单文件传输大小不超过1TB。配置源端和目的端参数时，字段名不可包含&和%。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
增量迁移原理介绍 - 数据治理中心 DataArts Studio

增量迁移原理介绍文件增量迁移关系数据库增量迁移 HBase/CloudTable增量迁移 MongoDB/DDS增量迁移父主题：关键操作指导

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

集群配置的创建方法请参见管理集群配置。 hive_01 单击“保存”回到连接管理界面。创建迁移作业选择“表/文件迁移 > 新建作业”，开始创建数据迁移任务，如图8所示。图8 创建MySQL到Hive的迁移任务 “导入前清空数据”选“是”，这样每次导入前，会将之前已经导入到Hive表的数据清空。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
概览 - 数据治理中心 DataArts Studio

概览本章节汇总了基于Migration实时数据集成服务常见应用场景的操作指导，每个实践我们提供了详细的方案描述和操作指导，用于指导您快速实现数据库迁移和同步。表1 Migration基础实践一览表数据源分类源端数据源对应目的端数据源相关文档关系型数据 MySQL Hadoop：MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

0.300）数据集成有两种迁移方式，支持的数据源有所不同：表/文件迁移：适用于数据入湖和数据上云场景下，表或文件级别的数据迁移，请参见表/文件迁移支持的数据源类型。整库迁移：适用于数据入湖和数据上云场景下，离线或自建数据库整体迁移场景，请参见整库迁移支持的数据源类型。本文介绍2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
设置CDM告警规则 - 数据治理中心 DataArts Studio

单击监控指标页面左上角的返回按钮，进入云监控服务的界面，选择“云数据迁移服务”服务监控项对应操作列的“创建告警规则”。图1 “云数据迁移服务”服务监控项根据界面提示设置CDM集群的告警规则。设置完成后，单击“确定”。当符合规则的告警产生时，系统会自动进行通知。更多关于监控告警的信息，请参见云监控用户指南。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群 > 管理并查看CDM监控指标
如何处理CDM从OBS迁移数据到DLI出现迁移中断失败的问题？ - 数据治理中心 DataArts Studio

如何处理CDM从OBS迁移数据到DLI出现迁移中断失败的问题？问题描述 CDM从OBS迁移数据到DLI出现迁移中断失败。解决方案此类作业问题表现为配置了脏数据写入，但并无脏数据。这种情况下需要调低并发任务数，即可避免此类问题。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

2.200）数据集成有两种迁移方式，支持的数据源有所不同：表/文件迁移：适用于数据入湖和数据上云场景下，表或文件级别的数据迁移，请参见表/文件迁移支持的数据源类型。整库迁移：适用于数据入湖和数据上云场景下，离线或自建数据库整体迁移场景，请参见整库迁移支持的数据源类型。本文介绍2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
指定文件名迁移 - 数据治理中心 DataArts Studio

现文件列表迁移。迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文件开始重新传，但不能从第2个文件失败的位置重新传。文件迁移时，单个任

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

3.300）数据集成有两种迁移方式，支持的数据源有所不同：表/文件迁移：适用于数据入湖和数据上云场景下，表或文件级别的数据迁移，请参见表/文件迁移支持的数据源类型。整库迁移：适用于数据入湖和数据上云场景下，离线或自建数据库整体迁移场景，请参见整库迁移支持的数据源类型。本文介绍2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
DES迁移一个月前的历史数据 - 数据治理中心 DataArts Studio

DES迁移一个月前的历史数据迁移流程通过脚本将一个月前的历史数据导入到DES盒子。DES盒子的相关操作请参见数据快递服务 DES。 DES将数据快递到华为云数据中心。使用华为云CDM将DES中的数据迁移到华为云OBS。使用华为云CDM将OBS数据迁移到MRS。其中CDM

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
文件格式介绍 - 数据治理中心 DataArts Studio

式”，可以用作文件的增量迁移，具体请参见文件增量迁移。增量迁移文件的时候，选择“重复文件处理方式”为“跳过重复文件”，这样如果源端有新增的文件，或者是迁移过程中出现了失败，只需要再次运行任务，已经迁移过的文件就不会再次迁移。写入到临时文件二进制迁移文件时候，可以在目的端指定

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
MD5校验文件一致性 - 数据治理中心 DataArts Studio

以不是存储迁移文件的桶）。如果源端没有MD5文件则不校验。迁移文件到文件系统时，目前只支持校验CDM抽取的文件是否与源文件一致（即只校验抽取的数据）。迁移文件到OBS时，支持抽取和写入文件时都校验。如果选择使用MD5校验，则无法使用KMS加密。父主题：数据迁移进阶实践

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
时间宏变量使用解析 - 数据治理中心 DataArts Studio

通过时间宏变量+定时执行作业，可以实现数据库增量同步和文件增量同步。如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 dateformat dateformat支持两种形式的参数：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 CDM在创建表/文件迁移的作业，支持连接器源端为关系型数据库时，在表字段映射中使用时间宏变量增加入库时间字段，用以记录关系型数据库的入库时间等用途。前提条件已创建连接器源端为关系型数据库，以及目的端数据连接。目的端数据表中已有时间日期字段或时间戳字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

由于CDM作业是异步运行的，运行作业的REST请求返回200，不代表数据已经迁移成功。后续有计算作业依赖CDM的迁移作业时，需要一个RestAPI节点去周期判断迁移是否成功，如果CDM迁移成功，再去做计算操作。查询CDM迁移是否成功的API，具体请参见《云数据迁移API参考》中“查询作业状态”章节。运行CD

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
参考：作业分片维度 - 数据治理中心 DataArts Studio

Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。对象存储对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
查看数据质量报告 - 数据治理中心 DataArts Studio

您可以通过以下两种方式导出质量报告：若使用局点有OBS服务，系统默认导出到关联的OBS桶中。由于质量报告数据量较大，单个导出文件字段条数最多为2000条，因此OBS桶里或许会有多个导出文件。导出的报告仅限当前工作空间内。若使用局点没有OBS服务，系统默认导出到本地。在DataArts St

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控

总条数： 1005

上一页
1
2
3
4
5
...
51
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据迁移进阶实践 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

增量迁移原理介绍 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

概览 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

设置CDM告警规则 - 数据治理中心 DataArts Studio

如何处理CDM从OBS迁移数据到DLI出现迁移中断失败的问题？ - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

DES迁移一个月前的历史数据 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线