搜索_华为云

如何选择版本 - 数据治理中心 DataArts Studio

代理使用，不建议同时作为Agent代理和运行数据迁移作业使用。用于运行数据迁移作业的其他规格数据集成集群推荐通过“批量数据迁移增量包”进行购买（免费版需通过“云数据迁移 CDM”服务购买CDM集群），如何购买请参考购买批量数据迁移增量包。 [2] 作业节点调度次数/天：该规格是以

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
配置HDFS源端参数 - 数据治理中心 DataArts Studio

法可参见文件增量迁移。 - 目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“,”分隔。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
质量作业和对账作业有什么区别？ - 数据治理中心 DataArts Studio

质量作业和对账作业的区别不清楚，需要说明下。解决方案质量作业可将创建的规则应用到建好的表中进行质量监控。对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据质量
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

常见配置举例如下： connectTimeout=360000与socketTimeout=360000：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位ms），避免超时导致失败。 useCursorFe

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置达梦数据库 DM源端参数 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。说明：表名支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有表（要求表中的字段个数和类型都一样）。例如： table

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
示例场景说明 - 数据治理中心 DataArts Studio

可以将离线或历史数据集成到云上。提供同构/异构数据源之间数据集成的服务，支持单表/文件迁移、整库迁移、增量集成，支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成创建集群新建数据迁移的源连接、目的连接新建表/文件迁移作业步骤4：元数据采集

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置ClickHouse目的端参数 - 数据治理中心 DataArts Studio

步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 高级属性单次写入行数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置元数据采集任务 - 数据治理中心 DataArts Studio

Oracle元数据采集前，需要确保数据连接中的数据库用户需要有数据表的读写权限以及对元数据的读取权限。详见ORACLE数据连接参数说明中的用户授权指导。受MRS集群限制，默认情况下元数据采集任务无法直接采集到Hive分区表的元数据。如果需要采集Hive分区表的元数据，需要在MRS集群内的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
事务模式迁移 - 数据治理中心 DataArts Studio

事务模式迁移 CDM的事务模式迁移，是指当CDM作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新建数据分类 - 数据治理中心 DataArts Studio

请进入数据密级管理页面进行设置，详情请参见新建数据密级。分类模板分类类型选择“内置”，呈现此参数。如果选择“内置”，用户可以根据实际需要选择系统内置的敏感数据识别定义模板，例如：时间、手机号、车牌号。分类名称分类类型选择“内置”，分类名称自动关联分类模板生成。分类类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据安全策略（待下线）
管理员操作 - 数据治理中心 DataArts Studio

据库模式（仅DWS需要）和数据表必须保持同名。数据库、数据库模式（仅DWS需要）、数据表等新建完成后，如果涉及原始数据表等，您还需要将两套数据湖服务之间的数据进行同步：数据湖中已有数据：通过CDM或DRS等数据迁移服务，在数据湖间批量同步数据。数据源待迁移数据：通过对等的C

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间 > 企业模式角色操作
配置MongoDB源端参数 - 数据治理中心 DataArts Studio

步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。是 table 高级属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
新建一个对账作业实例 - 数据治理中心 DataArts Studio

数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章分别以DLI和DWS作为数据源，介绍如何通过DataArts Studio中的数据质量模块实现跨源数据对账的基本一致性校验。环境准备需要准备好对账的数据源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
文件格式介绍 - 数据治理中心 DataArts Studio

文件增量迁移。增量迁移文件的时候，选择“重复文件处理方式”为“跳过重复文件”，这样如果源端有新增的文件，或者是迁移过程中出现了失败，只需要再次运行任务，已经迁移过的文件就不会再次迁移。写入到临时文件二进制迁移文件时候，可以在目的端指定是否写入到临时文件。如果指定了该参数，在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
配置Hive源端参数 - 数据治理中心 DataArts Studio

填写该参数表示指定抽取的WHERE子句，不指定则抽取整表。如果要迁移的表中没有WHERE子句的字段，则会迁移失败。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

常见配置举例如下： connectTimeout=360000与socketTimeout=360000：迁移数据量较大、或通过查询语句检索全表时，会由于连接超时导致迁移失败。此时可自定义连接超时时间与socket超时时间（单位ms），避免超时导致失败。 useCursorFe

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

le.csv 文件格式传输数据时使用的格式。支持CSV格式，JSON格式及二进制格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。 CSV格式 JSON类型文件格式为JSON格式时支持此参数。 JSON文件中存储的JSON对象的类型，可以选择JSON对象或JSON数组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM迁移性能如何？ - 数据治理中心 DataArts Studio

CDM迁移性能如何？单个cdm.large规格实例理论上可以支持1TB～8TB/天的数据迁移，实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据库部署在其他云 - 数据治理中心 DataArts Studio

接或VPN对端网关设备。其他云数据库添加白名单及安全组规则。其他云数据库需要添加Migration资源组VPC网段访问数据库的权限。各厂商云数据库添加白名单的方法不同，请参考各数据库官方文档进行操作。同时，其他云数据库若配置了安全组，则还需要增加入方向规则，放通Migrat

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
逻辑模型 - 数据治理中心 DataArts Studio

选择“导出对象”。选择“表”或者“DDL”。当选择DDL时，需要选择表，选择“全部”或者“部分”的表。选择部分表示，需要勾选所要导出的表。单击“确定”。逻辑实体更多操作同步在逻辑实体列表中，选择需要同步的逻辑实体，单击列表上方的“同步”，单击“确定”，完成逻辑实体的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研

总条数： 1066

上一页
1
...
7
8
9
...
54
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何选择版本 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

质量作业和对账作业有什么区别？ - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

配置达梦数据库 DM源端参数 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

配置ClickHouse目的端参数 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

事务模式迁移 - 数据治理中心 DataArts Studio

新建数据分类 - 数据治理中心 DataArts Studio

管理员操作 - 数据治理中心 DataArts Studio

配置MongoDB源端参数 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

CDM迁移性能如何？ - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

逻辑模型 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线