搜索_华为云

数据血缘方案简介 - 数据治理中心 DataArts Studio

一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手动配置。支持自动血缘解析的节点类型和场景请参见自动血缘解析。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

图1 正则表达式参数在迁移CSV格式的文件时，CDM支持使用正则表达式分隔字段，并按照解析后的结果写入目的端。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
数据血缘方案简介 - 数据治理中心 DataArts Studio

一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手动配置。支持自动血缘解析的节点类型和场景请参见自动血缘解析。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
字段转换器配置指导 - 数据治理中心 DataArts Studio

如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创建表/文件迁移作业的字段映射界面，可新建字段转换器，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

est1,est2 数据格式解析数据时使用的格式：二进制格式：适用于文件迁移场景，不解析数据内容原样传输。 CSV格式：以CSV格式解析源数据。 JSON：以JSON格式解析源数据。 CDC（DRS）：以DRS格式解析源数据。 CDC（JSON）：以JSON格式解析源数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
源端为Kafka - 数据治理中心 DataArts Studio

fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
源端为DIS - 数据治理中心 DataArts Studio

fromJobConfig.dataFormat 是枚举解析数据时使用的格式： BINARY：适用于文件迁移场景，不解析数据内容原样传输。 CSV：以CSV格式解析源数据。 fromJobConfig.separator 否 String 字段分隔符。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置Kafka源端参数 - 数据治理中心 DataArts Studio

cdm_topic 数据格式解析数据时使用的格式： JSON：以JSON格式解析源数据。 CSV格式：以CSV格式解析源数据。 JSON格式消费组ID 用户指定消费组ID。如果是从DMS Kafka导出数据，专享版请任意输入，标准版请输入有效的消费组ID。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
附录 - 数据治理中心 DataArts Studio

附录公共消息头解析响应消息体中的流状态码错误码

 帮助中心 > 数据治理中心 DataArts Studio > API参考
配置OBS源端参数 - 数据治理中心 DataArts Studio

CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。 JSON格式：以JSON格式解析源文件，一般都是用于迁移文件到数据表的场景。 ORC格式：以ORC格式解析源文件，一般都是用于迁移文件到数据表的场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
导出连接（待下线） - 数据治理中心 DataArts Studio

响应参数响应消息的Content-Type是application/octet-stream，需要解析转化为一个文件，可以参考解析响应消息体中的流样例代码。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

/ftp/a.csv|/ftp/b.txt 文件格式指CDM以哪种格式解析数据，可选择以下格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置OBS源端参数 - 数据治理中心 DataArts Studio

1 解析首行为列名 “前N行为标题行”选择“是”时才有该参数。选择是否将标题的首行解析为列名，在配置字段映射时会在原字段中显示该列名。说明：标题行数大于1时，当前仅支持解析标题的首行作为列名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据迁移进阶实践 - 数据治理中心 DataArts Studio

数据迁移进阶实践增量迁移原理介绍时间宏变量使用解析事务模式迁移迁移文件时加解密 MD5校验文件一致性字段转换器配置指导新增字段操作指导指定文件名迁移正则表达式分隔半结构化文本记录数据迁移入库时间文件格式介绍不支持数据类型转换规避指导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
CSS - 数据治理中心 DataArts Studio

CSS 功能通过CSS节点执行云搜索请求，实现在线分布式搜索功能。参数用户可参考表1和表2配置CSS节点的参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

说明：启用SSL认证后，Kafka会将Kafka Broker连接地址视做域名不断进行解析，导致性能消耗。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
批量导出作业 - 数据治理中心 DataArts Studio

可以参考解析响应消息体中的流样例代码。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
导出作业 - 数据治理中心 DataArts Studio

响应参数响应消息的Content-Type是application/octet-stream，需要解析转化为一个文件，可以参考解析响应消息体中的流样例代码。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
脚本开发流程 - 数据治理中心 DataArts Studio

脚本开发流程脚本开发功能提供如下能力：提供在线脚本编辑器，支持进行SQL、Shell、Python等脚本在线代码开发和调测。支持导入和导出脚本。支持使用变量和函数。提供编辑锁定能力，支持多人协同开发场景。支持脚本的版本管理能力，支持生成保存版本和提交版本。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发

总条数： 121

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据血缘方案简介 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

源端为Kafka - 数据治理中心 DataArts Studio

源端为DIS - 数据治理中心 DataArts Studio

配置Kafka源端参数 - 数据治理中心 DataArts Studio

附录 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

导出连接（待下线） - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

数据迁移进阶实践 - 数据治理中心 DataArts Studio

CSS - 数据治理中心 DataArts Studio

DMS Kafka连接参数说明 - 数据治理中心 DataArts Studio

批量导出作业 - 数据治理中心 DataArts Studio

导出作业 - 数据治理中心 DataArts Studio

脚本开发流程 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线