搜索_华为云

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
上传增量数据 - 数据治理中心 DataArts Studio

“重复周期”配置为1天。 “开始时间”配置为每天凌晨0点1分执行。这样CDM每天凌晨自动执行全量迁移，但因为“重复文件处理方式”选择了“跳过重复文件”，相同名称且相同大小的文件不迁移，所以只会上传每天新增的文件。单击“保存”，完成CDM的增量同步配置。父主题：使用CDM上传数据到OBS

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
导入导出 - 数据治理中心 DataArts Studio

后的表生效。上传模板选择所需导入的文件。所需导入的文件，可以通过以下两种方式获得。下载关系建模导入模板并填写模板在“导入配置”页签内，单击“下载关系建模导入模板”下载模板，然后根据业务需求填写好模板中的相关参数并保存。导出的表文件您可以将某个DataArts Stud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
约束与限制 - 数据治理中心 DataArts Studio

large规格最大可达到约8TB每天（大文件迁移到OBS场景）。推荐用户在正式迁移前先用小数据量实测进行速度摸底。迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
主机连接参数说明 - 数据治理中心 DataArts Studio

etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。端口是主机的SSH端口号。 Linux操作系统主机的默认登录端口为22，如有修改可通过主机路径“/etc/ssh/sshd_config”文件中的port字段确认端口号。 KMS密钥

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
字段类型映射关系 - 数据治理中心 DataArts Studio

MySQL与DWS字段类型映射 PostgreSQL与DWS字段类型映射 PostgreSQL与MRS Hudi字段类型映射 GaussDB集中式/分布式与DWS字段类型映射 SQLServer与DWS字段类型映射 SQLServer与Hudi字段类型映射 Oracle与MRS Hudi字段类型映射

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
通知周期概览 - 数据治理中心 DataArts Studio

该功能依赖于OBS服务。前提条件已开通消息通知服务并配置主题，为主题添加订阅。已提交作业，且作业不是“未启动”状态。已开通对象存储服务，并在OBS中创建文件夹。配置通知参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
HDFS连接 - 数据治理中心 DataArts Studio

配置此参数。 linkConfig.keytab 否 FileContent Kerveros认证所需的keytab文件的本地绝对路径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.runMode 否枚举选择HDFS连接的运行模式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
使用教程 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 Oracle同步到DMS Kafka作业配置 MongoDB同步到DWS作业配置 GaussDB集中式/分布式同步到DWS作业配置父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
支持的数据源 - 数据治理中心 DataArts Studio

数据仓库：DWS（公测中）说明：该链路目前需申请白名单后才能使用。如需使用该链路，请联系客服或技术支持人员。 GaussDB集中式/分布式同步到DWS作业配置 GaussDB集中式/分布式数据库建议使用版本：内核引擎版本505.1.0、505.1.0.SPC0100、505.2.0。 DWS建议使用版本：8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
导入作业 - 数据治理中心 DataArts Studio

导入作业功能介绍将存放在OBS桶的作业文件导入到DLF，一次可以导入一个或多个作业。执行本接口之前，需要将作业文件放到OBS的桶中。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 POST /v1/{project_id}/jobs/import

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
逻辑模型 - 数据治理中心 DataArts Studio

更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单击“添加文件”，选择编辑完成的导入模板。单击“上传文件”，上传完成后，自动跳转到“上次导入”页签，查看已导入的数据。单击“关闭”退出该页面。导入LDM 导入LDM模型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

接参数说明时，即将数据导入到Elasticsearch/云搜索服务（CSS）时，目的端作业参数如表1所示。表/文件迁移和整库迁移时需配置的参数不同，下表参数为表/文件迁移时的全量参数，实际参数以界面显示为准。表1 Elasticsearch/云搜索服务（CSS）作为目的端时的作业参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
任务性能调优 - 数据治理中心 DataArts Studio

Hudi参数调优 Oracle到DWS参数调优 Oracle到MRS Hudi参数调优 SQLServer到DWS参数调优 GaussDB集中式/分布式到DWS参数调优父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

新增访问密钥”，如图7所示。图7 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
导出导入作业 - 数据治理中心 DataArts Studio

获取到导出的zip文件。图1 选择并导出作业在弹出的“导出作业”界面，选择需要导出的作业范围和状态，单击“确定”，可以在下载中心查看导入结果。图2 导出作业导入作业导入作业功能依赖于OBS服务，如无OBS服务，可从本地导入。从OBS导入的作业文件，最大支持10Mb；

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
解析响应消息体中的流 - 数据治理中心 DataArts Studio

解析响应消息体中的流导出作业和导出连接的接口响应消息是一个流，需要转化为一个文件。您可以参考下面的样例代码： String EXPORT_JOB_URL = "https://{endpoint}/v1/{project_id}/jobs/{job_name}/export";

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录
Hive连接 - 数据治理中心 DataArts Studio

配置此参数。 linkConfig.keytab 否 FileContent Kerveros认证所需的keytab文件的本地绝对路径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.hiveVersion 是枚举 Hive版本：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
支持的数据源 - 数据治理中心 DataArts Studio

因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。不同CDM集群支持的数据源程度不一样，以实际为准。表/文件同步支持的数据源类型表/文件同步可以实现表或文件级别的数据同步。支持单表同步的数据源如表1 离线作业不同数据源读写能力说明所示：表1 离线作业不同数据源读写能力说明

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
FTP/SFTP连接 - 数据治理中心 DataArts Studio

FTP/SFTP连接介绍通过FTP或SFTP连接，可以对FTP或SFTP服务器抽取或加载文件，支持CSV、二进制和JSON格式。连接样例 { "links": [ { "link-config-values": {

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明

总条数： 530

上一页
1
...
4
5
6
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

上传增量数据 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

字段类型映射关系 - 数据治理中心 DataArts Studio

通知周期概览 - 数据治理中心 DataArts Studio

HDFS连接 - 数据治理中心 DataArts Studio

使用教程 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

导入作业 - 数据治理中心 DataArts Studio

逻辑模型 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

任务性能调优 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

解析响应消息体中的流 - 数据治理中心 DataArts Studio

Hive连接 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

FTP/SFTP连接 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线