搜索_华为云

新建数据质量作业 - 数据治理中心 DataArts Studio

选择了模板名称和版本后，SQL自动显示。规则权重设置规则的权重，支持按照字段级别设置权重。权重范围：【1-9】，整数。默认值为5。计算范围选择扫描区域支持选择“全表扫描”或“条件扫描”，默认为全表扫描。当仅需计算一部分数据，或需周期性按时间戳运行质量作业时，建议通过设置where条件进行条件扫描。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

消费者是从Topic订阅消息的一方，消费组是由一个或多个消费者组成的。Migration支持指定本次消费动作所属的Kafka消费组。 Kafka源端属性配置支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，具体参数可参考 Apache Kafka官方文档

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
新建离线处理集成作业 - 数据治理中心 DataArts Studio

当“作业调度身份是否可配置”设置为“是”，该参数可见。配置委托后，作业执行过程中，以委托的身份与其他服务交互。作业优先级自动匹配创建作业时配置的作业优先级，此处支持修改。实例超时时间配置作业实例的超时时间，设置为0或不配置时，该配置项不生效。如果您为作业设置了异常通知，当作业实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
Oracle同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

新建Topic的Partition数量设定目的端Kafka无对应Topic时，Migration自动建Topic的分区数量，默认为3。 Kafka目标端属性配置支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，具体参数可参考Apache Kafka官方文档中的配置说明。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
管理集群标签 - 数据治理中心 DataArts Studio

Studio服务进入数据集成界面可以看到。单击集群名称后，选择“标签”页签。图2 修改集群配置单击“添加/编辑标签”，通过添加、修改标签为CDM集群设置资源标识。图3 添加标签一个集群最多可添加10个标签。标签键（key）的最大长度为36个字符，标签值（value）的最大长度为43个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
IF条件判断教程 - 数据治理中心 DataArts Studio

节点和两个Dummy节点，选中连线图标并拖动，编排图1所示的作业。其中CDM节点的失败策略需要设置为“继续执行下一节点”。图2 配置CDM节点的失败策略右键单击连线，选择“设置条件”，在弹出的“编辑EL表达式”文本框中输入IF条件。每一个条件分支都需要填写IF条件，IF条

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置行级访问控制 - 数据治理中心 DataArts Studio

配置行级访问控制在业务开发过程中，存在多个开发者共同访问和维护同一张DWS表的场景，需要针对不同开发者设置不同行数据的访问权限。在这种场景下，您可以配置行级访问控制策略，为不同开发者按照行数据进行授权。在数据安全组件新建行级访问控制策略后，通过策略同步，会将行级访问控制策略同

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
GaussDB集中式/分布式同步到DWS作业配置 - 数据治理中心 DataArts Studio

使用和操作限制数据库限制源数据库参数要求：源库的password_encryption_type参数设置为1，修改用户密码使其生效。源库的wal_level参数设置为logical。源库的max_replication_slots参数值必须大于当前已使用的复制槽数量，可基于需要创建的实时作业数量评估。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置实时集成作业 - 数据治理中心 DataArts Studio

否：默认为否，不记录脏数据。表示不允许脏数据存在。如果同步过程中产生脏数据，任务将失败退出。是：允许脏数据，即任务产生脏数据时不影响任务执行。允许脏数据并设置其阈值时：若产生的脏数据在阈值范围内，同步任务将忽略脏数据（即不会写入目标端），并正常执行。若产生的脏数据超出阈值范围，同步任务将失败退出。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog.enabled boolean false - Hudi changelog功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
RDS数据连接参数说明 - 数据治理中心 DataArts Studio

关系型数据库数据源的访问地址，可填写为IP或域名。 “IP或域名”如果手动填写，必须写内网IP，端口必须为对资源组网段放开的端口（如需设置请参见设置安全组规则），否则可能导致网络连接不通。如果为RDS或GaussDB等云上数据源，可以通过管理控制台获取访问地址：根据注册的账号登录对应云服务的管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

目标数据库多的列要求非空且没有默认值，源数据库insert数据，同步到目标数据库后多的列为null，不符合目标数据库要求。目标数据库多的列设置固定默认值，且有唯一约束。源数据库insert多条数据后，同步到目标数据库后多的列为固定默认值，不符合目标数据库要求。 Migration

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

HDFS。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称，只能包含中文、英文字母、数字和下划线，不能以下划线开头，且长度不能超过100个字符。适用组件

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用SQL语句”选择“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

SQL脚本中开发完成的Hive SQL脚本“hive_sql”。数据连接：默认选择SQL脚本“hive_sql”中设置的数据连接，支持修改。数据库：默认选择SQL脚本“hive_sql”中设置的数据库，支持修改。作业编排完成后，单击，测试运行作业。如果运行成功，单击画布空白处，在右侧的“调度配置”页面，配置作业的调度策略。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

新建Topic的Partition数量设定目的端Kafka无对应Topic时，Migration自动建Topic的分区数量，默认为3。 Kafka目标端属性配置支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，具体参数可参考Apache Kafka官方文档中的配置说明。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

目的端数据库中的对象名需要满足约束：长度不超过63个字符，以字母或下划线开头，中间字符可以是字母、数字、下划线、$。源数据库的分区表触发器不可以设置为disable。如果做增量同步：源数据库的“pg_hba.conf” 文件中包含如下的配置： host replication all

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
通过API工具调用IAM认证方式的API - 数据治理中心 DataArts Studio

特定分页数据，您可以修改如下参数设置分页，其中pageSize表示分页后的页面大小，pageNum表示页码。图6 分页参数设置自定义分页的脚本/MyBatis方式API是在创建API时将分页逻辑写到取数SQL中，因此不支持在调用时修改分页设置。（可选）排序配置：默认情况下，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

自定义分页的脚本/MyBatis方式API是在创建API时将分页逻辑写到取数SQL中，因此不支持在调用时修改分页设置。（可选）默认情况下，系统会根据排序参数信息给出默认排序情况，自定义排序默认为升序。如果需要修改排序情况，可以修改如下参数设置。其中排序参数描述pre_order_by的值填写形式为“排序参数参数名:

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API

总条数： 545

上一页
1
...
9
10
11
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据质量作业 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

Oracle同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

管理集群标签 - 数据治理中心 DataArts Studio

IF条件判断教程 - 数据治理中心 DataArts Studio

配置行级访问控制 - 数据治理中心 DataArts Studio

GaussDB集中式/分布式同步到DWS作业配置 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

RDS数据连接参数说明 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

通过API工具调用IAM认证方式的API - 数据治理中心 DataArts Studio

（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线