搜索_华为云

配置DWS目的端参数 - 数据治理中心 DataArts Studio

只有当源端为关系数据库时，才有该参数。表示写入表数据时，用户选择的操作：不自动创建：不自动建表。不存在时创建：当目的端的数据库没有“表名”参数中指定的表时，CDM会自动创建该表。如果“表名”参数配置的表已存在，则不创建，数据写入到已存在的表中。先删除后创建：CDM先删除“表名”参数中指定的表，然后再重新创建该表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
更新表模型 - 数据治理中心 DataArts Studio

withName("tag1") ); WorkspaceVO modelbody = new WorkspaceVO(); modelbody.withId("1208730797675311104") .withName("xingneng2")

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
源端为HDFS - 数据治理中心 DataArts Studio

解密出来的数据会错误。 fromJobConfig.iv 否 String 解密需要的初始化向量，初始化向量由长度32的十六进制数组成，且必须与加密时配置的“toJobConfig.iv”（导入时配置的初始化向量）一致。如果不一致系统不会报异常，只是解密出来的数据会错误。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置YASHAN源端参数 - 数据治理中心 DataArts Studio

字段带有索引。 id 分区字段含有空值是否允许分区字段包含空值。多并发抽取时，若确定分区字段不含Null，将该值设为“否”可提升性能，若不确定，请设为“是”，否则可能会丢数据。否拆分作业选择“是”，会根据“作业拆分字段”值，将作业拆分为多个子作业并发执行。说明：仅支

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

文件不会被迁移。 ok.txt 等待时间启动作业标识文件为是时支持此参数。等待标识文件的时间。超时后任务会失败，当等待时间设置为0且源端路径下不存在标识文件，任务会立即失败。单位：秒。 60 标识文件类型启动作业标识文件为是时支持此参数。标识文件的类型。 MARK_DO

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

4xlarge 64核/128G 40/36 Gbit/s 64 - 其他场景中，可根据情况选择多个CDM集群同时迁移，加快迁移效率。MRS HDFS多副本策略会占用网络带宽，影响迁移速率。华为云CDM创建连接创建2个CDM集群： DataArts Studio实例中已经包含一个CDM集

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
SAP HANA数据连接参数说明 - 数据治理中心 DataArts Studio

从左侧列表选择实例管理。单击某一个实例名称，进入实例基本信息页面。在连接信息标签中可以获取到内网IP、域名和端口等信息。说明：仅GaussDB数据源支持多域名的方式，多个域名之间用“,”分隔。如果为MySQL、PostgreSQL或达梦数据库 DM等线下数据源，可以通过数据库管理员获取相应的访问地址。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置SAP HANA源端参数 - 数据治理中心 DataArts Studio

E、TIME、TIMESTAMP类型，建议该字段带有索引。 id 分片字段是否允许空值多并发抽取时，若确定分片字段不含Null，将该值设为“否”可提升性能，若不确定，请设为“是”，否则可能会丢数据。是父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业源端参数
RDS数据连接参数说明 - 数据治理中心 DataArts Studio

从左侧列表选择实例管理。单击某一个实例名称，进入实例基本信息页面。在连接信息标签中可以获取到内网IP、域名和端口等信息。说明：仅GaussDB数据源支持多域名的方式，多个域名之间用“,”分隔。如果为MySQL、PostgreSQL或达梦数据库 DM等线下数据源，可以通过数据库管理员获取相应的访问地址。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
源端为MySQL，目的端为DWS - 数据治理中心 DataArts Studio

库与表均支持自定义选择，即可选择一库一表，也可选择多库多表。目标端配置。图2 配置目标端参数源库表和目标匹配策略：库匹配策略：配置目标数据库的匹配策略，使数据按照规划迁移至目标库。用户需要提前创建对应数据库，否则可能导致后续自动建表失败。与来源库同名：会迁移至目的端对应与来源库同名的数据库中。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
配置默认项 - 数据治理中心 DataArts Studio

策略支持如下三种，系统默认配置为“取消执行”。等待执行：当被依赖的作业执行失败后，当前作业会等待执行。继续执行：当被依赖的作业执行失败后，当前作业会继续执行。取消执行：当被依赖的作业执行失败后，当前作业会取消执行。单击“保存”，对设置的配置项进行保存。该配置仅对新建作业有效。依赖的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
约束与限制 - 数据治理中心 DataArts Studio

手工清理。对象存储服务（OBS）数据源约束迁移文件时系统会自动并发，任务配置中的“抽取并发数”无效。不支持断点续传。CDM传文件失败会产生OBS碎片，需要用户到OBS控制台清理碎片文件避免空间占用。不支持对象多版本的迁移。增量迁移时，单个作业的源端目录下的文件数量或对象

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
开发Python脚本 - 数据治理中心 DataArts Studio

Shift + R：替换 Ctrl + X：剪切，光标未选中时剪切一行 Alt + 鼠标拖动：列模式编辑，修改一整块内容 Ctrl + 鼠标点选：多列模式编辑，多行缩进 Shift + Ctrl + K：删除当前行 Ctrl + →或Ctrl + ←：向右或向左按单词移动光标 Ctrl +

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

Hive上创建Hive分区表在MRS的Hive上使用下面SQL语句创建一张Hive分区表，表名与MySQL上的表trip_data一致，且Hive表比MySQL表多建三个字段y、ym、ymd，作为Hive的分区字段。SQL语句如下： 1 create table trip_data(TripID int

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
源端为PostgreSQL，目的端为DWS - 数据治理中心 DataArts Studio

库与表均支持自定义选择，即可选择一库一表，也可选择多库多表。目标端配置。图2 配置目标端参数源库表和目标匹配策略： Schema匹配策略：配置目标数据Schema的匹配策略，使数据按照规划迁移至目标库。用户需要提前创建对应数据库，否则可能导致后续自动建表失败。与来源库同名：会迁移至目的端对应与来源库同名的数据库中。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发 > 配置源端和目标端参数
管理静态脱敏任务 - 数据治理中心 DataArts Studio

静态脱敏时，请根据待脱敏数据的字段类型正确选择脱敏算法，否则可能会导致数据库数据异常。例如对date字段使用数值随机算法脱敏，会导致data类型将被强制脱敏为数值类型（Hive和DLI脱敏），或者写入失败报错（DWS脱敏）；对数值字段使用哈希算法脱敏，会导致数值类型被强制脱敏为哈希值字符串（Hive

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
新建整库迁移作业 - 数据治理中心 DataArts Studio

Redis的每个键前缀、Elasticsearch的每个类型、MongoDB的每个集合都会作为一个子任务并发执行。整库迁移作业每次运行，会根据整库作业的配置重建子任务，不支持修改子任务后再重新运行主作业。支持整库迁移的数据源请参见支持的数据源。约束限制配置源端和目的端参数时，字段名不可包含&和%。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

机名之间使用空格分隔，多对映射使用分号或回车换行分隔。 KMS密钥否使用集群配置为是时，是必选项。通过KMS加解密数据源认证信息，选择KMS中的任一默认密钥或自定义密钥即可。说明：第一次通过DataArts Studio或KPS使用KMS加密时，会自动生成默认密钥dlf

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Import GES - 数据治理中心 DataArts Studio

写为“single”类型，不支持自定义。生成元数据功能本身，支持一次生成多对点表和边表的元数据xml文件。但考虑到Import GES节点的“边数据集”和“点数据集”参数，分别只能选择一张表，建议您在有多对点表和边表的情况下，分拆多个Import GES节点分别导入，以确保导入

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
文件格式介绍 - 数据治理中心 DataArts Studio

这个参数是针对CSV文件导出到其它地方的场景，如果源端指定了该参数，CDM在抽取数据时将第一行作为标题行。在传输CSV文件的时候会跳过标题行，这时源端抽取的行数，会比目的端写入的行数多一行，并在日志文件中进行说明跳过了标题行。写入文件大小这个参数是针对数据库导出到CSV文件的场景，如果一张表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导

总条数： 94

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置DWS目的端参数 - 数据治理中心 DataArts Studio

更新表模型 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

配置YASHAN源端参数 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

SAP HANA数据连接参数说明 - 数据治理中心 DataArts Studio

配置SAP HANA源端参数 - 数据治理中心 DataArts Studio

RDS数据连接参数说明 - 数据治理中心 DataArts Studio

源端为MySQL，目的端为DWS - 数据治理中心 DataArts Studio

配置默认项 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

源端为PostgreSQL，目的端为DWS - 数据治理中心 DataArts Studio

管理静态脱敏任务 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线