搜索_华为云

源端为HDFS - 数据治理中心 DataArts Studio

果输入的是多个文件路径，CDM使用这里配置的文件分隔符来区分各个文件，默认为“|”。 fromJobConfig.filterType 否枚举选择过滤器类型： WILDCARD：输入通配符作为过滤文件，满足过滤条件的路径或文件会被传输。 TIME：时间过滤器，当文件的修改时间晚于输入的时间时，该文件才会被传输。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
HDFS连接 - 数据治理中心 DataArts Studio

配置此参数。 linkConfig.keytab 否 FileContent Kerveros认证所需的keytab文件的本地绝对路径，您也可以联系管理员获取此文件。使用集群配置前需在集群配置管理中配置此参数。 linkConfig.runMode 否枚举选择HDFS连接的运行模式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
管理样本库 - 数据治理中心 DataArts Studio

脱敏，则测试算法时限制样本文件大小不能超过10kb。注意，10kb仅为算法测试功能的限制，静态脱敏时并不限制样本文件大小不超过10kb。样本文件大小建议不超过10MB，否则运行需要解析样本文件的静态脱敏任务时，静态脱敏任务可能会失败。 OBS样本文件只能用于DLI引擎的静态脱敏

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
字段转换器配置指导 - 数据治理中心 DataArts Studio

作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创建表/文件迁移作业的字段映射界面，可新建字段转换器，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
目的端为OBS - 数据治理中心 DataArts Studio

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
字段转换器配置指导 - 数据治理中心 DataArts Studio

作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创建表/文件迁移作业的字段映射界面，可新建字段转换器，如下图所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
一个空间可以创建同一数据源的多个连接吗？ - 数据治理中心 DataArts Studio

一个空间可以创建同一数据源的多个连接吗？工作空间内允许创建多个同一数据源的连接，但是连接的名字不能相同。需要注意的是，为便于后续开发过程中选择到正确的数据连接，建议您为连接做好命名区分，避免出现混淆。父主题：管理中心

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
主机连接参数说明 - 数据治理中心 DataArts Studio

CDM集群作为管理中心数据连接Agent时，单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时，通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运行上限为200，超出的任务将排队等待。建议您按照业务量情况规划多个Agent分担压力。在调度Shell、Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
新增字段操作指导 - 数据治理中心 DataArts Studio

作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
新增字段操作指导 - 数据治理中心 DataArts Studio

作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
导出导入脚本 - 数据治理中心 DataArts Studio

导出脚本。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出脚本在弹出的“导出脚本”界面，选择需要导出的脚本的状态，单击“确定”。图2 导出脚本导入脚本导入脚本功能依赖于OBS服务，如无OBS服务，可从本地导入。您可以在脚本目录中导入一个或多个脚本文件。导入会覆盖开发态的内容，并自动提交一个新版本。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
数据开发概述 - 数据治理中心 DataArts Studio

业，更好地实现业务需求和目标。每个解决方案可以包含一个或多个业务相关的作业，一个作业可以被多个解决方案复用。作业：作业由一个或多个节点组成，执行作业可以完成对数据的一系列操作。脚本：脚本（Script）是一种批处理文件的延伸，是一种纯文本保存的程序，一般来说的计算机脚本程序是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
配置Hive源端参数 - 数据治理中心 DataArts Studio

传输模式支持记录迁移和文件迁移默认为记录迁移。仅当源端为Hive2.x且数据存储在HDFS、目的端为Hive3.x且数据存在OBS并行文件系统时，才支持文件迁移。当选择文件迁移时，需保证源端和目的端的表格式和属性需一致才能迁移成功。记录迁移文件迁移分区过滤条件 “读取方式”选择“HDFS”时显示此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
导出导入作业 - 数据治理中心 DataArts Studio

从本地导入的作业文件，最大支持1Mb。从本地导入的作业文件，解压后大小最大支持1Mb。如果导入的作业在系统中有重名时，需要确保系统中该作业状态为“停止”时，才能导入成功。在作业目录中导入一个或多个作业在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。单击作业目录中的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
管理资源 - 数据治理中心 DataArts Studio

字符、“_”、“-”，且长度为1~32个字符。类型是选择资源的文件类型： jar：用户jar文件。 pyFile：用户Python文件。 file：用户文件。 archive：用户AI模型文件。支持的文件后缀名为：zip、tgz、tar.gz、tar、jar。资源位置是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
配置Hive源端参数 - 数据治理中心 DataArts Studio

default 表名输入或选择Hive表名。单击输入框后面的按钮可进入表的选择界面。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
配置元数据采集任务 - 数据治理中心 DataArts Studio

选择待采集数据的采集范围。选择“当前文件夹”，采集任务仅采集OBS路径中设置的文件夹下的对象。选择“当前文件夹和所有子文件夹”，采集任务会采集OBS路径中设置的文件夹下所有的对象，包括其子文件夹下的对象采集内容选择待采集数据的采集内容。选择“文件夹和对象”，采集任务采集文件夹和对象。选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
迁移准备 - 数据治理中心 DataArts Studio

使用华为云专线搭建CDH集群与华为云VPC之间的专属连接通道。迁移流程预估迁移数据量、迁移时间。输出详细待迁移数据表、文件个数、大小，用于后续校验。分批配置迁移任务，保证迁移进度与速度。校验文件个数以及文件大小。在MRS中恢复HBase表并验证。准备数据项目数据项说明取值示例 DES盒子

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖

总条数： 586

上一页
1
2
3
4
5
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为HDFS - 数据治理中心 DataArts Studio

HDFS连接 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

一个空间可以创建同一数据源的多个连接吗？ - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

导出导入脚本 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

导出导入作业 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

迁移准备 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线