搜索_华为云

（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

（可选）修改作业日志存储路径作业日志和DLI脏数据默认存储在以dlf-log-{Project id}命名的OBS桶中，您也可以自定义日志和DLI脏数据存储路径，支持基于工作区全局配置OBS桶。约束限制该功能依赖于OBS服务。 OBS路径仅支持OBS桶，不支持并行文件系统。前提条件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
参考：作业分片维度 - 数据治理中心 DataArts Studio

对象存储服务（OBS）支持按文件分片。文件系统 FTP 支持按文件分片。 SFTP 支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 PostgreSQL 支持按表字段分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
OBS连接 - 数据治理中心 DataArts Studio

storageType 是 String 对象存储的类型。 linkConfig.obsBucketType 否 String OBS桶类型。对象桶：OB。并行文件系统：PFS。说明：桶类型分为对象桶和并行文件系统，对象桶过滤文件会比较慢，建议客户使用并行文件桶。 linkConfig.server

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
源端为HDFS - 数据治理中心 DataArts Studio

inputFormat 是枚举传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式。 PARQUET_FILE：PARQUET格式。 BINARY_FILE：二进制格式。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.columnList

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置Hive源端参数 - 数据治理中心 DataArts Studio

包括HDFS和JDBC两种读取方式。默认为HDFS方式，如果没有使用WHERE条件进行数据过滤及在字段映射页面添加新字段的需求，选择HDFS方式即可。 HDFS文件方式读取数据时，性能较好，但不支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。 JDBC方式读取数据时，支持使用WHERE条

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据集成概述 - 数据治理中心 DataArts Studio

字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，CDM支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档支持将迁移过程中处理失败的、被清洗过滤掉的、不符合

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
备份管理 - 数据治理中心 DataArts Studio

”命名的文件夹内。环境变量，资源，脚本和作业分别存储在1_env,2_resources,3_scripts和4_jobs文件夹内。备份成功后，在以“备份日期”命名的文件夹内，自动生成backup.json文件，该文件按照节点类型存储了作业信息，支持恢复作业前进行修改。启动每

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
目的端为OBS - 数据治理中心 DataArts Studio

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

源连接名称：选择创建MRS HDFS连接中的“hdfs_llink”。源目录或文件：待迁移数据的目录或单个文件路径。文件格式：传输数据时所用的文件格式，这里选择“二进制格式”。不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。其他可选参数一般情况下保持默认即可。目的端作业配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
嵌入数据水印 - 数据治理中心 DataArts Studio

需审批，审批通过后采取数据水印技术生成可外发数据文件。数据版权保护通过在关系数据库中嵌入代表所有权的水印信息，可以将数据库与其拥有者联系起来，从而实现数据的版权保护。对泄露数据进行快速溯源通过对泄露数据文件解封，根据数据文件的完整度和水印信息痕迹来检测水印是否存在，快速识

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 数据水印
配置OBS目的端参数 - 数据治理中心 DataArts Studio

directory/ 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
调度作业 - 数据治理中心 DataArts Studio

选择要监听的OBS路径，如果该路径下有新增文件，则触发调度；新增的文件的路径名，可以通过变量Job.trigger.obsNewFiles引用。前提条件：该OBS路径已经配置DIS消息通知。最大处理文件数节点被驱动运行时，每批次最多可处理的文件数。当“触发事件类型”选择“OBS”时才需要配置。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
迁移准备 - 数据治理中心 DataArts Studio

使用华为云专线搭建CDH集群与华为云VPC之间的专属连接通道。迁移流程预估迁移数据量、迁移时间。输出详细待迁移数据表、文件个数、大小，用于后续校验。分批配置迁移任务，保证迁移进度与速度。校验文件个数以及文件大小。在MRS中恢复HBase表并验证。准备数据项目数据项说明取值示例 DES盒子

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
溯源数据水印 - 数据治理中心 DataArts Studio

描述为更好地识别嵌入水印任务，此处加以描述信息。长度不能超过1024个字符。源文件得到泄露的数据文件后，利用其生成CSV格式文件，注意文件大小不超过20MB。字段分隔符根据上传的CSV文件，下拉选择分隔符，支持四种“,”、“Tab”、“|”、“;”。默认选择“,”。单击“运行”，完成创建数据水印溯源任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 数据水印
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

/user/output 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

Parquet格式：按Parquet格式写入，适用于数据表到文件的迁移。 ORC格式：按ORC格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/SFTP/HDFS/

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
管理密钥（高级特性） - 数据治理中心 DataArts Studio

管理密钥（高级特性）管理密钥用于存储密钥的信息。密钥可用于如下场景：数据集成（离线作业）进行表数据迁移时，在“敏感数据检测”发现敏感数据后，如果需要通过转换器进行加密，则要从数据安全获取密钥信息，详见配置离线处理集成作业。在数据安全进行文件加密时，需要获取密钥信息，详见文件加密（高级特性）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 数据加密
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

数据集成提供30+同构/异构数据源之间数据集成的功能，帮助您实现数据自由流动。支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成基于分布式计算框架，利用并行化处理技术，支持用户稳定高效地对海量数据进行移动，实现不停服数据迁移，快速构建所需的数据架构。

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
是否支持批量创建作业？ - 数据治理中心 DataArts Studio

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
导入主题 - 数据治理中心 DataArts Studio

variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment String ak = System.getenv("CLOUD_SDK_AK"); String sk = System.get

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 导入导出接口

总条数： 854

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

（可选）修改作业日志存储路径 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

嵌入数据水印 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

调度作业 - 数据治理中心 DataArts Studio

迁移准备 - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

管理密钥（高级特性） - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

是否支持批量创建作业？ - 数据治理中心 DataArts Studio

导入主题 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线