搜索_华为云

DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

数据开发组件：作业，作业目录，脚本，脚本目录和资源。数据质量组件：质量作业和对账作业。数据目录组件：技术资产中的表（Table）和文件（File）类型资产，以及元数据采集任务。数据服务组件：数据服务集群，API和APP。数据安全组件：敏感数据发现任务，脱敏策略，静态脱敏任务和数据水印任务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为“数据开发作业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。在创建CDM表/文件迁移的作业，源连接选择为HBase连接或CloudTable连接时，高级属性的可选参数中可以配置时间区间。图1 HBase时间区间起始

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

CDM集群和数据服务专享版集群在工作空间之间相互隔离，建议您在新空间提前准备好对应旧空间的集群。搬迁依赖于OBS功能，请您提前规划OBS桶和文件夹目录。 DataArts Studio数据搬迁时，依赖各组件的备份或导入导出能力。您可以根据自己的数据需求，自由选择搬迁哪个组件的数据。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
配置数据血缘 - 数据治理中心 DataArts Studio

支持自动血缘解析的作业节点及场景作业节点支持场景 DLI SQL 支持解析DLI中表与表之间数据插入产生的血缘。支持通过建表语句产生的OBS文件到DLI表之间的血缘。 DWS SQL 支持Insert into等DML操作产生的DWS表之间的血缘。 MRS Hive SQL 支持Insert

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置数据血缘 - 数据治理中心 DataArts Studio

支持自动血缘解析的作业节点及场景作业节点支持场景 DLI SQL 支持解析DLI中表与表之间数据插入产生的血缘。支持通过建表语句产生的OBS文件到DLI表之间的血缘。 DWS SQL 支持Insert into等DML操作产生的DWS表之间的血缘。 MRS Hive SQL 支持Insert

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
查询集群详情 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

业计划启动时间-偏移量”，而不是“CDM作业实际启动时间-偏移量”。 table 高级属性迁移行为选择写入目的端的迁移方式。新增：将文件记录直接插入指定的集合。有则替换，无则新增：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记录。如果不存在，则添加新记录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
新建数据质量作业 - 数据治理中心 DataArts Studio

覆盖：如果质量作业名称有重复，会覆盖现有同名作业。如果选择覆盖，请在导入文件前，停止所有作业调度，否则调度中的作业会导致上传文件失败。单击“上传文件”，选择准备好的数据文件。可通过如下两种方式填写数据文件： (推荐使用) 通过“导出”功能，可将数据直接/或修改后批量导入系统。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
运行历史 - 数据治理中心 DataArts Studio

果。下载脚本历史运行结果。系统默认支持所有用户都能下载脚本的历史运行结果。您可以在结果页签单击“下载结果”。支持将CSV格式的结果文件下载到本地。查询结果和下载结果最大支持1000条。作业运行历史在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
查询集群列表 - 数据治理中心 DataArts Studio

REBOOT_FAILURE：重启失败。 type String 节点类型，只支持一种类型“cdm”。 id String 节点的虚拟机ID。 name String 节点的虚拟机名称。 isFrozen String 节点是否冻结：0：否。1：是。 components String 组件。 config_status

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
指定集群创建作业 - 数据治理中心 DataArts Studio

作业列表，请参见jobs数据结构说明。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
修改作业 - 数据治理中心 DataArts Studio

作业列表，请参见jobs数据结构说明。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
配置DIS源端参数 - 数据治理中心 DataArts Studio

最早：最小偏移量，即拉取最早的数据。最新 APP名字配置用户数据消费程序的唯一标识符，不存在时会自动创建。 cdm 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON格式：以JSON格式解析源数据。二进制格式字段分隔符

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
随机集群创建作业并执行 - 数据治理中心 DataArts Studio

作业并执行作业。表4 Job 参数是否必选参数类型描述 job_type 是 String 作业类型： NORMAL_JOB：表/文件迁移。 BATCH_JOB：整库迁移。 SCENARIO_JOB：场景迁移。 from-connector-name 是 String 源端连接类型，对应的连接参数如下：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
导出资源 - 数据治理中心 DataArts Studio

resources 否 Array of longs 资源ID数组。 export_mode 否 String 导出模式，null表示导出到本地文件系统，obs表示导出至obs，仅限于导出质量报告使用。 obs_service_type 否 String 业务类型，technology

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 导入导出接口
配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

的账号是否有元数据查询的权限。 COLLECTION 迁移行为将记录迁移到MongoDB目的端时，选择需要进行的插入行为操作。新增：将文件记录直接插入指定的集合。有则新增，无则替换：以指定的过滤键作为查询条件。如果在集合中找到匹配的记录，则替换该记录（找到多条匹配记录时，只

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
下载中心 - 数据治理中心 DataArts Studio

路径为准。单击“确定”。查看脚本执行的结果选择“数据开发 > 下载中心”进入“下载中心”页面。可以查看本地下载任务和异步转储任务的文件名、操作人，操作时间，操作类型，任务状态，OBS路径。对于转储任务下载失败的记录可以查看记录。单击“操作”列的，可以从OBS路径下载数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发

总条数： 438

上一页
1
...
17
18
19
...
22
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataArts Studio的工作空间可以删除吗？ - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

DataArts Studio配置数据搬迁简介 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

查询集群详情 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

运行历史 - 数据治理中心 DataArts Studio

查询集群列表 - 数据治理中心 DataArts Studio

指定集群创建作业 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

配置DIS源端参数 - 数据治理中心 DataArts Studio

随机集群创建作业并执行 - 数据治理中心 DataArts Studio

导出资源 - 数据治理中心 DataArts Studio

配置MongoDB目的端参数 - 数据治理中心 DataArts Studio

下载中心 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线