搜索_华为云

目的端为OBS - 数据治理中心 DataArts Studio

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
主机连接参数说明 - 数据治理中心 DataArts Studio

etc/hosts.allow文件里面。 CDM集群的内网IP获取方式请参见查看并修改CDM集群配置。端口是主机的SSH端口号。 Linux操作系统主机的默认登录端口为22，如有修改可通过主机路径“/etc/ssh/sshd_config”文件中的port字段确认端口号。 KMS密钥

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
HDFS连接 - 数据治理中心 DataArts Studio

配置此参数。 linkConfig.keytab 否 FileContent Kerveros认证所需的keytab文件的本地绝对路径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.runMode 否枚举选择HDFS连接的运行模式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
Import GES - 数据治理中心 DataArts Studio

缺失。生成元数据xml文件是手动单击“生成元数据”触发的，如果在该节点在后续的作业调度运行中，点表和边表结构发生变化，元数据xml文件并不会随之更新，需要手动进入新建元数据窗口，再次单击“生成元数据”重新生成新的元数据xml文件。生成的元数据xml文件，属性（Property

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置Hive源端参数 - 数据治理中心 DataArts Studio

传输模式支持记录迁移和文件迁移默认为记录迁移。仅当源端为Hive2.x且数据存储在HDFS、目的端为Hive3.x且数据存在OBS并行文件系统时，才支持文件迁移。当选择文件迁移时，需保证源端和目的端的表格式和属性需一致才能迁移成功。记录迁移文件迁移分区过滤条件 “读取方式”选择“HDFS”时显示此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
备份管理 - 数据治理中心 DataArts Studio

对象自动存储在以“备份日期”命名的文件夹内。环境变量，资源，脚本和作业分别存储在1_env,2_resources,3_scripts和4_jobs文件夹内。备份成功后，在以“备份日期”命名的文件夹内，自动生成backup.json文件，该文件按照节点类型存储了作业信息，支持恢复作业前进行修改。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

接参数说明时，即将数据导入到Elasticsearch/云搜索服务（CSS）时，目的端作业参数如表1所示。表/文件迁移和整库迁移时需配置的参数不同，下表参数为表/文件迁移时的全量参数，实际参数以界面显示为准。表1 Elasticsearch/云搜索服务（CSS）作为目的端时的作业参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
导入作业 - 数据治理中心 DataArts Studio

导入作业功能介绍将存放在OBS桶的作业文件导入到DLF，一次可以导入一个或多个作业。执行本接口之前，需要将作业文件放到OBS的桶中。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 POST /v1/{project_id}/jobs/import

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
导出导入作业 - 数据治理中心 DataArts Studio

获取到导出的zip文件。图1 选择并导出作业在弹出的“导出作业”界面，选择需要导出的作业范围和状态，单击“确定”，可以在下载中心查看导入结果。图2 导出作业导入作业导入作业功能依赖于OBS服务，如无OBS服务，可从本地导入。从OBS导入的作业文件，最大支持10Mb；

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
解析响应消息体中的流 - 数据治理中心 DataArts Studio

解析响应消息体中的流导出作业和导出连接的接口响应消息是一个流，需要转化为一个文件。您可以参考下面的样例代码： String EXPORT_JOB_URL = "https://{endpoint}/v1/{project_id}/jobs/{job_name}/export";

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录
FTP/SFTP连接 - 数据治理中心 DataArts Studio

FTP/SFTP连接介绍通过FTP或SFTP连接，可以对FTP或SFTP服务器抽取或加载文件，支持CSV、二进制和JSON格式。连接样例 { "links": [ { "link-config-values": {

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
配置Hive源端参数 - 数据治理中心 DataArts Studio

包括HDFS和JDBC两种读取方式。默认为HDFS方式，如果没有使用WHERE条件进行数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。 JDBC方式读取数据时，支持使用WHERE条

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
导入连接（待下线） - 数据治理中心 DataArts Studio

参数说明：参数名是否必选参数类型说明 path 是 String 有OBS场景：连接定义文件在OBS上的路径，连接定义文件的格式参考导出连接的响应消息。无OBS场景：连接定义文件在本地的路径。 params 否 List<Params> 连接参数，默认值为空。 sameNamePolicy

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

FTP/SFTP连接参数说明 FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到数据库。当前仅支持Linux操作系统的FTP 服务器。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。连接FTP或S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
实时作业监控 - 数据治理中心 DataArts Studio

选择DIS通道，当指定的DIS通道有新消息时，数据开发模块将新消息传递给作业，触发该作业运行。事件处理并发数选择作业并行处理的数量，最大并发数为10。事件检测间隔配置事件检测时间间隔。时间间隔单位可以配置为秒或分钟。失败策略选择调度失败后的策略：结束调度忽略失败，继续调度图4 DIS调度策略配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
导入导出 - 数据治理中心 DataArts Studio

后的表生效。上传模板选择所需导入的文件。所需导入的文件，可以通过以下两种方式获得。下载关系建模导入模板并填写模板在“导入配置”页签内，单击“下载关系建模导入模板”下载模板，然后根据业务需求填写好模板中的相关参数并保存。导出的表文件您可以将某个DataArts Stud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
产品功能 - 数据治理中心 DataArts Studio

据。字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，数据集成支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档支持将迁移过程中处理失败的、被清洗过滤

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
产品优势 - 数据治理中心 DataArts Studio

型设计，智能化的帮助用户生成数据处理代码，数据处理全流程质量监控，异常事件实时通知。丰富的数据开发类型支持多人在线协作开发，脚本开发可支持SQL、Shell在线编辑、实时查询；作业开发可支持CDM、SQL、MRS、Shell、Spark等多种数据处理节点，提供丰富的调度配置策略与海量的作业调度能力。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
开发Python脚本 - 数据治理中心 DataArts Studio

请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

Kafka官方文档中的配置说明。配置目的端参数。图6 目的端OBS配置文件存储格式写入OBS的文件格式，当前支持Parquet、SequenceFile和TextFile。文件压缩方式指定写入OBS文件的压缩方式，默认不进行压缩，支持以下列表： Parquet格式：UNCOMPRESSED、SNAPPY。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程

总条数： 379

上一页
1
2
3
4
5
...
19
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

目的端为OBS - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

HDFS连接 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

导入作业 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

解析响应消息体中的流 - 数据治理中心 DataArts Studio

FTP/SFTP连接 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

导入连接（待下线） - 数据治理中心 DataArts Studio

FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

实时作业监控 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

产品优势 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线