搜索_华为云

自动建表原理介绍 - 数据治理中心 DataArts Studio

Warehouse Service，简称DWS）中自动建表时，DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM将Oracle整库迁移到DWS，CDM在DWS上自动建表，会将Oracle的NUMBER(3,0)字段映射到DWS的SMALLINT。图1 自动建表的字段映射

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
创建连接（待下线） - 数据治理中心 DataArts Studio

是否必选参数类型说明 ip 是 String 主机的地址 port 是 String 主机的SSH端口号 userName 是 String 主机的登录用户名 password 是 String 主机的登录方式为密码时，填写主机的登录密码。 agentName 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
配置数据血缘 - 数据治理中心 DataArts Studio

无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手动配置。支持自动血缘解析的节点类型和场景请参见自动血缘解析。手动配置血缘，是在数据开发作业节点中，自定义

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置数据血缘 - 数据治理中心 DataArts Studio

无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手动配置。支持自动血缘解析的节点类型和场景请参见自动血缘解析。手动配置血缘，是在数据开发作业节点中，自定义

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
DLI连接参数说明 - 数据治理中心 DataArts Studio

户，密码不会立即生效且作业会运行失败。迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予DLI连接中使用AK/SK所在用户对dli-trans*桶的读、写、创建目录对象等权限，否则会导致迁移失败。dli-trans*内部临时桶的权限

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

log数据的文件扩展名。 .dat/.jpg/.png 自定义目录层次选择“是”时，支持迁移后的文件按照自定义的目录存储。即只迁移文件，不迁移文件所归属的目录。是目录层次自定义迁移后文件的存储路径，支持时间宏变量。说明：源端为关系型数据库数据源时，目录层次为源端表名+自定义目录，其他场景下为自定义目录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
产品功能 - 数据治理中心 DataArts Studio

迁移几百张表。增量数据迁移支持文件增量迁移、关系型数据库增量迁移、HBase增量迁移，以及使用Where条件配合时间变量函数实现增量数据迁移。事务模式迁移支持当迁移作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
步骤2：数据集成 - 数据治理中心 DataArts Studio

看到新建的作业。图11 迁移作业运行结果参考步骤6~步骤8，再新建名为ratings_obs2dws的迁移作业，将ratings.csv数据迁移到DWS的ratings_item表中。待作业运行成功后，数据迁移结束。图12 数据迁移结果数据迁移结束后，您也可以跳转到数据开发页面，新建一个DWS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
主机连接参数说明 - 数据治理中心 DataArts Studio

压力。在调度Shell、Python脚本时，Agent会访问ECS主机，如果Shell、Python脚本的调度频率很高，ECS主机会将Agent的内网IP加入黑名单。为了保障作业的正常调度，强烈建议您使用ECS主机的root用户将绑定Agent（即CDM集群）的内网IP加到/etc/hosts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置分库源端参数 - 数据治理中心 DataArts Studio

抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
入门实践 - 数据治理中心 DataArts Studio

通过数据质量对比数据迁移前后结果数据对账对数据迁移流程中的数据一致性至关重要，数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本文以DWS数据迁移到MRS Hive分区表为例，介绍如何通过DataArts Studio中的数据质量模块实现数据迁移前后的一致性校验。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，此处的“文件格式”只能选择与源端的文件格式一致。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
关键操作指导 - 数据治理中心 DataArts Studio

关键操作指导增量迁移原理介绍事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导自动建表原理介绍父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
分库连接参数说明 - 数据治理中心 DataArts Studio

分库连接参数说明分库指的是同时连接多个后端数据源，该连接可作为作业源端，将多个数据源的数据合一迁移到其他数据源上。连接参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 分库连接参数参数名说明

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置SQLServer源端参数 - 数据治理中心 DataArts Studio

抽取整表。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

user; 传输模式支持记录迁移和文件迁移默认为记录迁移。仅当源端为Hive2.x且数据存储在HDFS、目的端为Hive3.x且数据存在OBS并行文件系统时，才支持文件迁移。当选择文件迁移时，需保证源端和目的端的表格式和属性需一致才能迁移成功。记录迁移文件迁移分区过滤条件 “读取方式”选择“HDFS”时显示此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
车联网大数据零丢失搬迁入湖 - 数据治理中心 DataArts Studio

车联网大数据零丢失搬迁入湖车联网大数搬迁入湖简介场景介绍迁移准备 CDM迁移近一个月的数据 DES迁移一个月前的历史数据 MRS中恢复HBase表

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

常见配置举例如下： connectTimeout=360000与socketTimeout=360000：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位ms），避免超时导致失败。 useCursorFe

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置OBS源端参数 - 数据治理中心 DataArts Studio

参数名说明取值样例基本参数桶名待迁移数据所在的桶名。 BUCKET_2 文件格式传输数据时使用的格式。 CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 ORC格式：以ORC

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数

总条数： 459

上一页
1
...
8
9
10
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

自动建表原理介绍 - 数据治理中心 DataArts Studio

创建连接（待下线） - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

DLI连接参数说明 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

步骤2：数据集成 - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

配置分库源端参数 - 数据治理中心 DataArts Studio

入门实践 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

关键操作指导 - 数据治理中心 DataArts Studio

分库连接参数说明 - 数据治理中心 DataArts Studio

配置PostgreSQL源端参数 - 数据治理中心 DataArts Studio

配置SQLServer源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

车联网大数据零丢失搬迁入湖 - 数据治理中心 DataArts Studio

SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线