搜索_华为云

数据集成（CDM作业） - 数据治理中心 DataArts Studio

API创建数据迁移作业？如何将云下内网或第三方云上的私网与CDM连通？ CDM是否支持参数或者变量？ CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？日志提示解析日期格式失败时怎么处理？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
Data Quality Monitor - 数据治理中心 DataArts Studio

DQC作业类型为对账作业时需要配置。是：如果该对账作业处于告警状态时，当前节点的状态将被设置为成功，继续执行后续节点。否：如果该对账作业处于告警状态时，则当前节点的状态将被设置为失败。表2 高级参数参数是否必选说明节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Kafka到DLI实时同步中，作业运行失败，报“Array element access needs an index starting at 1 but was 0”怎么办？ - 数据治理中心 DataArts Studio

的第一个元素），如果误用了下标0，那么作业会运行失败，故发现该问题为赋值数组下标设置错误导致，需重新设置。图2 原有参数配置解决方案修改字段赋值为a[1]，提交作业版本重新启动即可。图3 设置目标表的赋值参数父主题：数据集成（实时作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
配置Rest Client源端参数 - 数据治理中心 DataArts Studio

分页大小参数名称分页大小参数名称，默认放到query参数中。如果参数名设置为page_size，也支持通过#page_size获取。 page_size 分页页码参数名称分页参数名称，默认放到query参数中。如果参数名设置为page_index，也支持通过#page_index获取。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
查看数据质量报告 - 数据治理中心 DataArts Studio

业务报告的统计范围是依据数据架构主题关联匹配的质量作业运行的结果，包含主题域、主题域分组、业务对象、表名、评分等信息。查看技术报告数据质量评分质量评分的满分可设置为5分，10分，100分。默认为5分制，是以表关联的规则为基础进行评分的。而表、数据库等不同维度的评分均基于规则评分，本质上是基于规则评分在不同维度下的加权平均值进行计算的。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置Hive目的端参数 - 数据治理中心 DataArts Studio

不处理删除 Hive表分区字段 “自动创建”设置为“不自动创建”时，无该此参数。对Hive建表设置分区字段，多个值以逗号隔开。 A,B 表路径 “自动创建”设置为“不自动创建”时，无该此参数。表路径。 - 存储格式 “自动创建”设置为“不自动创建”时，无该此参数。选择存储格式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
约束与限制 - 数据治理中心 DataArts Studio

DWS主键或表只有一个字段时，要求字段类型必须是如下常用的字符串、数值、日期类型。从其他数据库迁移到DWS时，如果选择自动建表，主键必须为以下类型，未设置主键的情况下至少要有一个字段是以下类型，否则会无法创建表导致CDM作业失败。 INTEGER TYPES：TINYINT，SMALLINT

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
配置DataArts Studio资源迁移 - 数据治理中心 DataArts Studio

单击“导出文件”，配置文件的OBS存储位置和文件名称。图2 选择导出文件单击“下一步”，勾选导出的模块。图3 勾选导出的模块单击“下一步”，等待导出完成，资源包导出到所设置的OBS存储位置。图4 导出完成导出资源耗时1分钟仍未显示结果则表示导出失败，请重试。如果仍然无法导出，请联系客服或技术支持人员协助解决。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
基线运维约束限制 - 数据治理中心 DataArts Studio

DLI约束限制： DLI提供的设置作业优先级功能，当资源不充足时，可以优先满足优先级较高的作业的计算资源。DLI优先级功能包含DLI Flink Job、DLI SQL和DLI Spark三个作业算子。只有运行在弹性资源池上的作业支持设置作业优先级。弹性资源池上的SQL作业支持作业优先级。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
GaussDB集中式/分布式到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
性能调优 - 数据治理中心 DataArts Studio

避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
管理中心配置数据搬迁 - 数据治理中心 DataArts Studio

单击“新建导出”，配置文件的OBS存储位置和文件名称。图2 选择导出文件单击“下一步”，勾选导出的模块。图3 勾选导出的模块单击“下一步”，等待导出完成，资源包导出到所设置的OBS存储位置。图4 导出完成导出资源耗时1分钟仍未显示结果则表示导出失败，请重试。如果仍然无法导出，请联系客服或技术支持人员协助解决。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
DWS SQL - 数据治理中心 DataArts Studio

若选择SQL语句方式，数据开发模块将无法解析您输入SQL语句中携带的参数。数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。脚本参数否关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

文件。图4 选择JSON文件 JSON文件上传成功后，单击“设置密码”，配置数据连接的密码或SK。图5 进入设置密码在设置密码弹窗中，依次输入各数据连接的密码或SK，完成后单击确认，回到导入作业界面。图6 设置密码在导入作业界面，单击确认，开始导入。图7 开始导入导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX（单分区数据量大小（G）/2G*2，再后向上取整，1）。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
迁移作业原理 - 数据治理中心 DataArts Studio

创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
添加工作空间成员和角色 - 数据治理中心 DataArts Studio

发责任人、运维管理员设置为管理员角色。开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
批作业监控 - 数据治理中心 DataArts Studio

异常问题。是否设置周期补数据是，补数据时会按照设置的周期进行补数据任务。第一个值表示具体的值。第二个值表示按指定周期补数据，例如：小时、天，周、月。说明：设置周期后，将会按照周期进行补数据任务调度。对于调度周期为分钟，间隔小时以及天的任务，将按照新设置的周期去调度补数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

t_type_开头，命名规则为“数据库名称_汇总表编码”）中复制的，复制节点后需手动配置该节点的“数据连接”和“数据库”参数，“数据库”需设置为事实表所在的数据库。数据开发作业自动生成功能需在管理配置中心中勾选“创建数据开发作业”实现。图14 按付款方式汇总统计节点属性按费率汇总统计节点：为MRS

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 545

上一页
1
...
11
12
13
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据集成（CDM作业） - 数据治理中心 DataArts Studio

Data Quality Monitor - 数据治理中心 DataArts Studio

Kafka到DLI实时同步中，作业运行失败，报“Array element access needs an index starting at 1 but was 0”怎么办？ - 数据治理中心 DataArts Studio

配置Rest Client源端参数 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

配置Hive目的端参数 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

配置DataArts Studio资源迁移 - 数据治理中心 DataArts Studio

基线运维约束限制 - 数据治理中心 DataArts Studio

GaussDB集中式/分布式到DWS参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

管理中心配置数据搬迁 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

添加工作空间成员和角色 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线