搜索_华为云

新建整库迁移作业 - 数据治理中心 DataArts Studio

关系型数据库的每张表、Redis的每个键前缀、Elasticsearch的每个类型、MongoDB的每个集合都会作为一个子任务并发执行。整库迁移作业每次运行，会根据整库作业的配置重建子任务，不支持修改子任务后再重新运行主作业。支持整库迁移的数据源请参见支持的数据源。约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
DIS Client - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
主机连接参数说明 - 数据治理中心 DataArts Studio

了保障作业的正常调度，强烈建议您使用ECS主机的root用户将绑定Agent（即CDM集群）的内网IP加到/etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。端口是主机的SSH端口号。 Linux操作系统主机的默认登录端口

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
创建MySQL连接器 - 数据治理中心 DataArts Studio

方式一：单击对应驱动名称右侧操作列的“上传”，选择本地已下载的驱动。方式二：单击对应驱动名称右侧操作列的“从sftp复制”，配置sftp连接器名称和驱动文件路径。在“集群管理”界面，单击集群后的“作业管理”，选择“连接管理 > 新建连接”，进入连接器类型的选择界面，如图1所示。图1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
新建一个对账作业实例 - 数据治理中心 DataArts Studio

数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章分别以DLI和DWS作为数据源，介绍如何通过DataArts Studio中的数据质量模块实现跨源数据对账的基本一致性校验。环境准备需要准备好对账的数据源，即通过管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

景。 CSV格式换行符处理方式指定在写入文本文件表的数据包含换行符，特指(\n|\r|\r\n)的情况下处理换行符的策略。删除不处理替换为其他字符串删除换行符替换字符串当换行符处理方式选择为替换时，指定替换的字符串。 - 高级属性写入到临时文件文件格式为二进制格式时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
查看数据资产 - 数据治理中心 DataArts Studio

采集任务。技术资产中的数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。需要注意的是，数据血缘关系删除需要通过删除作业或删除作业元数据的方式进行，仅将作业停止调度不会触发血缘关系的删除。资产搜索通过资产名称和描述的关键字或按所有属性搜索资产，支持模糊搜索。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
约束与限制 - 数据治理中心 DataArts Studio

中重启集群才能更新生效。单作业的抽取并发数取值范围为1-300，集群的总抽取并发数取值范围为1-1000。其中集群最大抽取并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2，作业的抽取并发数建议不超过集群的总抽取并发数，过高的并发数可能导致内存溢出，请谨慎修改。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
企业模式简介 - 数据治理中心 DataArts Studio

DataArts Studio建立于对应工作空间物理属性之上的任务开发与运维机制介绍。不同模式工作空间的优劣势对比不同工作空间模式的优劣势对比。企业模式对使用流程的影响介绍企业模式工作空间下的流程管控。不同工作空间模式下，DataArts Studio模块对应操作简单模式仅有生

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
删除连接（待下线） - 数据治理中心 DataArts Studio

请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数无请求示例删除一个连接。 DELETE /v1/b384b9

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
配置Redis目的端参数 - 数据治理中心 DataArts Studio

写入前将相同的键删除写入前将相同的键删除。否：如果原来Redis已存在类型不同的同名key，则迁移作业会跳过该key。是：Redis会先删除原有的同名key，再执行迁移。否键分隔符用来分隔关系型数据库的表和列名。 _ 值分隔符以STRING方式存储时，列之间的分隔符。 ;

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
（可选）自定义工作空间角色 - 数据治理中心 DataArts Studio

角色名称：标识自定义角色的唯一标识。建议您按照该角色的使用场景等进行命名，避免无意义的描述。角色描述：补充对该角色的相关说明，如与预置角色的关键权限差异等。角色类型：由于简单模式与企业模式下角色权限有所差异，因此需要根据该角色的使用场景来选择角色类型。企业模式的相关介绍请参见企业模式概述。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

过滤类型为通配符或正则表达式时支持此参数。用于过滤输入路径下的文件。通配符使用*csv 正则表达式使用.*\.csv 时间过滤用于过滤满足时间范围的文件。文件的修改时间晚于输入的起始时间或早于输入的终止时间才会被传输。同时输入起始时间和终止时间，文件的修改时间在这个区间内才会被传输。否起始时间

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
源端为Kafka - 数据治理中心 DataArts Studio

fromJobConfig.kafkaConsumerStrategy 是枚举从Kafka拉取数据时的初始偏移量设置： LATEST：最大偏移量，即最新的数据。 EARLIEST：最小偏移量，即最老的数据。 fromJobConfig.isPermanency 是 Boolean 是否永久运行。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
（可选）自定义工作空间角色 - 数据治理中心 DataArts Studio

角色名称：标识自定义角色的唯一标识。建议您按照该角色的使用场景等进行命名，避免无意义的描述。角色描述：补充对该角色的相关说明，如与预置角色的关键权限差异等。角色类型：由于简单模式与企业模式下角色权限有所差异，因此需要根据该角色的使用场景来选择角色类型。企业模式的相关介绍请参见企业模式概述。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 授权用户使用DataArts Studio
CDM Job - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
创建业务指标 - 数据治理中心 DataArts Studio

参数参数类型描述 data data object data，统一的返回结果的最外层数据结构。表8 data 参数参数类型描述 value BizMetricVO object value，统一的返回结果的外层数据结构。表9 BizMetricVO 参数参数类型描述 id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
更新业务指标 - 数据治理中心 DataArts Studio

响应Body参数参数参数类型描述 data data object data，统一的返回结果的最外层数据结构。表8 data 参数参数类型描述 value Object value，统一的返回结果的外层数据结构。表9 BizMetricVO 参数参数类型描述 id String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
停止作业 - 数据治理中心 DataArts Studio

请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。说明：多个DataArts Studio实例需要指定工作空间。当工作空

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
目的端为Hive - 数据治理中心 DataArts Studio

写入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明

总条数： 876

上一页
1
...
17
18
19
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建整库迁移作业 - 数据治理中心 DataArts Studio

DIS Client - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

创建MySQL连接器 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

查看数据资产 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

企业模式简介 - 数据治理中心 DataArts Studio

删除连接（待下线） - 数据治理中心 DataArts Studio

配置Redis目的端参数 - 数据治理中心 DataArts Studio

（可选）自定义工作空间角色 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

（可选）自定义工作空间角色 - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

创建业务指标 - 数据治理中心 DataArts Studio

更新业务指标 - 数据治理中心 DataArts Studio

停止作业 - 数据治理中心 DataArts Studio

目的端为Hive - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线