搜索_华为云

配置增量元数据采集任务 - 数据治理中心 DataArts Studio

配置增量元数据采集任务配置、运行采集任务是构建数据资产的前提，下面举例说明如何通过配置采集任务达到灵活采集元数据的目的。场景一：仅添加新元数据用户的数据库中新增的数据表，采集任务仅采集新增的表。例如新增table4的情况下：采集前的数据表元数据：table1，table2，table3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程
数据服务简介 - 数据治理中心 DataArts Studio

安全。 API开放方使用流程您作为API提供者，需要实现一个或一组API的开放，那么您需要先后完成以下工作：购买并管理专享版集群如果您需要使用数据服务专享版，需要先购买专享版集群。新建数据服务审核人在创建API前，需要新建数据服务审核人。创建API 创建API即生成A

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
配置ClickHouse源端参数 - 数据治理中心 DataArts Studio

时抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

适合10GE高速带宽进行TB以上的数据量迁移。 cdm.4xlarge 64核/128G 40/36 Gbit/s 64 - 其他场景中，可根据情况选择多个CDM集群同时迁移，加快迁移效率。MRS HDFS多副本策略会占用网络带宽，影响迁移速率。华为云CDM创建连接创建2个CDM集群：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
配置DWS源端参数 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。说明：表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
查看数据血缘 - 数据治理中心 DataArts Studio

系。如需更新，需要等待冷却期结束或将数据开发作业再次提交版本后调度。数据血缘关系删除需要通过删除作业或删除作业元数据的方式进行，仅将作业停止调度不会触发血缘关系的删除。新建并运行元数据采集任务请参见配置元数据采集任务，新建并运行元数据采集任务，注意任务中需要选择待查看血缘关系的数据表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置DLI目的端参数 - 数据治理中心 DataArts Studio

表1 DLI作为目的端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。新建队列操作请参考创建队列。 cdm 数据库名称写入数据的数据库名称。 dli 表名写入数据的表名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 高级属性迁移行为选择写入目的端的迁移方式。新增：将文件记录直接插入指定的集合。有则替换，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
事务模式迁移 - 数据治理中心 DataArts Studio

事务模式迁移 CDM的事务模式迁移，是指当CDM作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
记录数据迁移入库时间 - 数据治理中心 DataArts Studio

单击“保存并运行”，回到作业管理的表/文件迁移界面，在作业管理界面可查看作业执行进度和结果。作业执行成功后，单击作业操作列的“历史记录”，可查看该作业的历史执行记录、读取和写入的统计数据。在历史记录界面单击“日志”，可查看作业的日志信息。前往目的端数据源查看数据迁移的入库时间。父主题：数据迁移进阶实践

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

DRS（数据复制服务）任务迁移到Migration，完成作业切换和数据续传。前提条件已创建DRS实时同步任务，DRS相关操作请参见数据复制服务。已按使用前自检概览准备好实时数据集成环境。准备动作 Migration所需资源估算。根据业务实际情况估算DRS作业迁移到Migratio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。是 index_sample 类型类似关系数据库的schema或数据库名称，整库迁移多索引以逗号分隔。支持输入索引别名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置Doris目的端参数 - 数据治理中心 DataArts Studio

步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 导入开始前导入数据前，选择是否清除目的表的数据：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
上传CDM连接驱动 - 数据治理中心 DataArts Studio

表1 获取驱动关系数据库类型驱动名称获取地址建议版本云数据库 MySQL MySQL MYSQL https://downloads.mysql.com/archives/c-j/ 5.1.48版本，获取mysql-connector-java-5.1.48.jar Oracle

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
配置Hudi目的端参数 - 数据治理中心 DataArts Studio

步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 cdm 自动建表模式是否自动创建Hudi表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置HBase 源端参数 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。是 table 整表迁移源端和目的端都为HBase时显示该参数。整表迁移通过二进制传输数据，表的所有信息都会传递。HBase->HBase整表迁移会传递

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

常见配置举例如下： connectTimeout=360000与socketTimeout=360000：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位ms），避免超时导致失败。 useCursorFe

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置OBS源端参数 - 数据治理中心 DataArts Studio

参数名说明取值样例基本参数桶名待迁移数据所在的桶名。 BUCKET_2 文件格式传输数据时使用的格式。 CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 ORC格式：以ORC

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
如何选择版本 - 数据治理中心 DataArts Studio

代理使用，不建议同时作为Agent代理和运行数据迁移作业使用。用于运行数据迁移作业的其他规格数据集成集群推荐通过“批量数据迁移增量包”进行购买（免费版需通过“云数据迁移 CDM”服务购买CDM集群），如何购买请参考购买批量数据迁移增量包。 [2] 作业节点调度次数/天：该规格是以

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
新建数据对账作业 - 数据治理中心 DataArts Studio

where条件输入where子句，系统会选择符合条件的数据进行扫描。说明：配置where条件语句时，最前面需要加and，因为在SQL生成中需要进行语法的校验，否则会报语法错误。例如需要筛选数据表中“age”字段在 (18, 60] 区间范围内的数据时，where条件可设置为如下内容：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控

总条数： 1067

上一页
1
...
6
7
8
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置增量元数据采集任务 - 数据治理中心 DataArts Studio

数据服务简介 - 数据治理中心 DataArts Studio

配置ClickHouse源端参数 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

配置DWS源端参数 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

配置DLI目的端参数 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

事务模式迁移 - 数据治理中心 DataArts Studio

记录数据迁移入库时间 - 数据治理中心 DataArts Studio

DRS任务切换到实时Migration作业配置 - 数据治理中心 DataArts Studio

配置ElasticSearch源端参数 - 数据治理中心 DataArts Studio

配置Doris目的端参数 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

配置Hudi目的端参数 - 数据治理中心 DataArts Studio

配置HBase 源端参数 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

如何选择版本 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线