搜索_华为云

CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度，您可参考下文有效配置抽取并发数。集群最大抽取并发数的上限建议为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
新建复合指标 - 数据治理中心 DataArts Studio

环比增长率描述描述信息。支持的长度为0~600个字符。表达式 *设定表达式选择所需要的衍生指标或复合指标，并根据实际需求在“表达式”中设置表达式。同比增长率 *同比配置选择年同比、月同比或者周同比。 *设定衍生指标选择所需要的衍生指标，此处仅展示有时间限定衍生指标。系统

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
步骤1：数据准备 - 数据治理中心 DataArts Studio

可以在下拉列表中选择已有的标签。适用组件：保持默认即可。 SSL加密：是否开启，请与源端DWS集群的配置保持一致。连接方式：选择“通过代理连接”。手动：选择“集群名”模式，“IP”和“端口”不需要手动填写。 DWS集群名：选择所创建的DWS集群。 KMS密钥：选择一个KMS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
立即执行作业 - 数据治理中心 DataArts Studio

作业名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
修改作业名称 - 数据治理中心 DataArts Studio

原作业名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。 X-Auth-Token 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

ava-5.1.48.jar，然后进行上传。 - 单击“保存”回到连接管理界面。如果保存时出错，一般是由于MySQL数据库的安全设置问题，需要设置允许CDM集群的EIP访问MySQL数据库。创建DWS连接在CDM集群管理界面，单击集群后的“作业管理”，选择“连接管理 > 新

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
删除作业 - 数据治理中心 DataArts Studio

作业名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。单击“提交”。数据质量作业配置完成。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

目标数据库多的列要求非空且没有默认值，源数据库insert数据，同步到目标数据库后多的列为null，不符合目标数据库要求。目标数据库多的列设置固定默认值，且有唯一约束。源数据库insert多条数据后，同步到目标数据库后多的列为固定默认值，不符合目标数据库要求。 Migration

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置任务组 - 数据治理中心 DataArts Studio

描述描述信息。单击“确定”，任务组创建完成。配置完成后，请前往作业开发界面，在所需作业画布右侧“调度配置”页签，选择任务组，即可按照设置好的任务组更细粒度的进行当前任务组中的作业节点的并发数控制。后续操作修改：单击“修改”，可以修改已配置好的任务组。任务组的修改是实时生效的。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

目的端数据库中的对象名需要满足约束：长度不超过63个字符，以字母或下划线开头，中间字符可以是字母、数字、下划线、$。源数据库的分区表触发器不可以设置为disable。如果做增量同步：源数据库的“pg_hba.conf” 文件中包含如下的配置： host replication all

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
云数据库MySQL/MySQL数据库连接参数说明 - 数据治理中心 DataArts Studio

如果是导入到RDS上的MySQL数据库，由于RDS上的MySQL默认没有开启LOAD DATA功能，所以同时需要修改MySQL实例的参数组，将“local_infile”设置为“ON”，开启该功能。说明：如果RDS上的“local_infile”参数组不可编辑，则说明是默认参数组，需要先创建一个新的参数组，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
重跑作业实例 - 数据治理中心 DataArts Studio

表。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
修改连接（待下线） - 数据治理中心 DataArts Studio

是否校验，默认否。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 Connection参数说明参数名

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 连接管理API（待下线）
查询作业文件 - 数据治理中心 DataArts Studio

作业定义文件在OBS上的路径。例如obs://myBucket/jobs.zip。 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。响应参数表3 参数说明参数名是否必选

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
配置Hudi目的端参数 - 数据治理中心 DataArts Studio

字段的值替换为当前时间。所选字段必须为timestamp类型。 - 写入参数在执行Spark SQL往hudi插入数据前，通过set语法设置参数，从而控制spark的写入行为。 hoodie.combine.before.upsert 父主题：配置作业目的端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
定义识别规则分组 - 数据治理中心 DataArts Studio

数据识别规则页面。单击页面上方“规则分组”页签，进入分组列表页面。图1 新建数据识别规则组单击“新建”，输入新建分组名称和描述，参数设置参考表1，并勾选左侧列表中的识别规则。配置完成后单击“确定”即可。图2 新建分组参数配置您所勾选的规则将显示在右侧列表中，右侧已选列表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
配置实时集成作业 - 数据治理中心 DataArts Studio

否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。允许脏数据并设置其阈值时：若产生的脏数据在阈值范围内，同步任务将忽略脏数据（即不会写入目标端），并正常执行。若产生的脏数据超出阈值范围，同步任务将失败退出。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
执行脚本 - 数据治理中心 DataArts Studio

脚本名称。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
批量导出作业 - 数据治理中心 DataArts Studio

D。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 参数说明参数名是否必选参数类型

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API

总条数： 471

上一页
1
...
16
17
18
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CDM作业配置管理 - 数据治理中心 DataArts Studio

新建复合指标 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

立即执行作业 - 数据治理中心 DataArts Studio

修改作业名称 - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

删除作业 - 数据治理中心 DataArts Studio

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

配置任务组 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

云数据库MySQL/MySQL数据库连接参数说明 - 数据治理中心 DataArts Studio

重跑作业实例 - 数据治理中心 DataArts Studio

修改连接（待下线） - 数据治理中心 DataArts Studio

查询作业文件 - 数据治理中心 DataArts Studio

配置Hudi目的端参数 - 数据治理中心 DataArts Studio

定义识别规则分组 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

执行脚本 - 数据治理中心 DataArts Studio

批量导出作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线