搜索_华为云

性能调优 - 数据治理中心 DataArts Studio

避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
添加工作空间成员和角色 - 数据治理中心 DataArts Studio

发责任人、运维管理员设置为管理员角色。开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
查询作业状态 - 数据治理中心 DataArts Studio

write_rows Integer 写入数据行数。 execute-date Long 执行时间。 status String 作业状态： BOOTING：启动中。 FAILURE_ON_SUBMIT：提交失败。 RUNNING：运行中。 SUCCEEDED：成功。 FAILED：失败。 UNKNOWN：未知。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
创建简单模式工作空间 - 数据治理中心 DataArts Studio

Studio工作空间模式，使用方便，但无法对数据开发流程和表权限进行强管控。企业模式：企业模式下DataArts Studio数据开发组件以及对应管理中心组件数据连接支持设置开发环境和生产环境，有效隔离开发者对生产环境业务的影响。企业模式的相关介绍请参见企业模式概述。企业项目 DataArts Studio实

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
查看数据血缘 - 数据治理中心 DataArts Studio

请参见配置元数据采集任务，新建并运行元数据采集任务，注意任务中需要选择待查看血缘关系的数据表。如果此前已创建并运行过待查看数据表的元数据采集任务，此操作可跳过。启动作业调度元数据采集完成后，系统基于最新的作业调度实例产生相关的数据血缘关系。参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
新增字段操作指导 - 数据治理中心 DataArts Studio

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

上表中非云服务的数据源，例如MySQL，既可以支持用户本地数据中心自建的MySQL，也可以是用户在ECS上自建的MySQL，还可以是第三方云的MySQL服务。整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
实例监控 - 数据治理中心 DataArts Studio

> 实例监控”。在作业所在的“操作”列，单击“重跑”设置重跑当前作业实例；或单击作业名称左边的复选框，再选择页面上方的“重跑”按钮可以批量设置多个作业的实例重跑。图1 设置单个作业重跑图2 批量设置作业重跑批量设置多个作业实例重跑时，仅需要配置重跑开始位置、使用的作业参数、是否忽略OBS监听等参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
数据指标概述 - 数据治理中心 DataArts Studio

数据指标概述在DataArts Studio数据指标的使用中，指标定义用于指导指标开发，用于定义指标的设置目的、计算公式等，并不进行实际运算，可与指标开发进行关联。而指标开发是指标定义的具体实现，定义了指标如何计算。数据指标功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标
MRS HetuEngine - 数据治理中心 DataArts Studio

脚本先创建和开发脚本。数据连接是默认选择SQL脚本中设置的数据连接，支持修改。模式是 Hetu支持的数据源。用户可以在MRS Manager的Hetu组件中自行添加数据源。数据库是默认选择SQL脚本中设置的数据库，支持修改。资源队列否输入资源队列名称。脚本参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Impala SQL - 数据治理中心 DataArts Studio

选择需要执行的脚本。如果脚本未创建，请参考新建脚本和开发SQL脚本先创建和开发脚本。数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。资源队列否输入资源队列名称。脚本参数否关联的SQL脚本如果使用了参数，此处显

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新增字段操作指导 - 数据治理中心 DataArts Studio

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。在没有主键的场景下，如果没有选择分布列，DWS会默认第一列作为分布列，可能会有数据倾斜风险。如CDM不支持源端迁移

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
新建维度 - 数据治理中心 DataArts Studio

内容是可枚举的维度。层级维度：属性之间具有层级结构的维度。高级配置设置自定义项，以对表进行描述。自定义项设置完成后仅可用于在表详情中进行查看，无特殊需求时无需设置。例如您需要标识该表的来源时，可以设置自定义项配置名为“来源”，值为对应的表来源信息。配置完成后可以在表详情中查看该信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
创建集群 - 数据治理中心 DataArts Studio

f6：表示cdm.small规格，2核CPU、4G内存的虚拟机。适合PoC验证和开发测试。 fb8fe666-6734-4b11-bc6c-43d11db3c745：表示cdm.medium规格，4核CPU、8G内存的虚拟机适合单张表规模<1000万条的场景。 5ddb1071-

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
新建事实表 - 数据治理中心 DataArts Studio

根据下拉框选择对应的资产责任人，可以手动输入名字或直接选择已有的责任人。高级配置设置自定义项，以对表进行描述。自定义项设置完成后仅可用于在表详情中进行查看，无特殊需求时无需设置。例如您需要标识该表的来源时，可以设置自定义项配置名为“来源”，值为对应的表来源信息。配置完成后可以在表详情中查看该信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
查看数据质量报告 - 数据治理中心 DataArts Studio

业务报告的统计范围是依据数据架构主题关联匹配的质量作业运行的结果，包含主题域、主题域分组、业务对象、表名、评分等信息。查看技术报告数据质量评分质量评分的满分可设置为5分，10分，100分。默认为5分制，是以表关联的规则为基础进行评分的。而表、数据库等不同维度的评分均基于规则评分，本质上是基于规则评分在不同维度下的加权平均值进行计算的。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控

总条数： 923

上一页
1
...
37
38
39
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - 数据治理中心 DataArts Studio

添加工作空间成员和角色 - 数据治理中心 DataArts Studio

查询作业状态 - 数据治理中心 DataArts Studio

创建简单模式工作空间 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

实例监控 - 数据治理中心 DataArts Studio

数据指标概述 - 数据治理中心 DataArts Studio

MRS HetuEngine - 数据治理中心 DataArts Studio

MRS Impala SQL - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线