搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

了资源队列时，此处配置的资源队列为最高优先级。 SQL脚本是仅“脚本类型”配置为“在线脚本”时可以配置。选择已创建的Spark Python脚本。脚本参数否仅“脚本类型”配置为“在线脚本”时可以配置。关联的Spark Python脚本中如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据开发概述 - 数据治理中心 DataArts Studio

支持管理DWS、DLI、MRS Hive等多种数据仓库。支持可视化和DDL方式管理数据库表。脚本开发提供在线脚本编辑器，支持多人协作进行SQL、Shell、Python脚本在线代码开发和调测。支持使用变量和函数。作业开发提供图形化设计器，支持拖拉拽方式快速构建数据处理工作流。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
配置脱敏策略 - 数据治理中心 DataArts Studio

面进行选择，这里不再赘述。配置完成后单击“确定”。已被绑定脱敏算法的分类规则不支持被重复绑定。图1 新建脱敏适配脱敏算法后，支持用户在线进行测试。输入测试数据，单击“测试”，在测试结果文本框中进行验证。开启或关闭状态，只有启用状态下的脱敏策略才可生效。查看数据脱敏效果在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据安全策略（待下线）
配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

于一次全量写入场景。微批模式为异步分批写入Hoodie，适用于对入库时间SLA要求较为严格的场景，以及对资源消耗较小，对MOR表存储类型在线进行压缩的场景。说明：运行-失败重试期间不允许修改此模式。是批次数据大小 “全量模式写Hoodie”设置为“否”时，使用微批模式呈现此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

、溪流和其他来源，并且是原始数据。表2 数据湖与数据仓库的对比维度数据湖数据仓库应用场景可以探索性分析所有类型的数据，包括机器学习、数据发现、特征分析、预测等通过历史的结构化数据进行数据分析使用成本起步成本低，后期成本较高起步成本高，后期成本较低数据质量包

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
编排API简介 - 数据治理中心 DataArts Studio

有且只有一个输出处理算子，并位于最下游，直接上游必须为普通API算子，必须配置至少一个结果映射。 API工作流不能有环状结构，不能有孤立算子，最多支持20层深度。图1 API工作流编排页面表1 API工作流算子介绍配置入口算子是否必选介绍触发器入口API 必选入口API算子是AP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

对象存储迁移服务（Object Storage Migration Service，简称OMS）是一种线上数据迁移服务，帮助您将其他云服务商对象存储服务中的数据在线迁移至华为云的对象存储服务（Object Storage Service，OBS）中。简言之，入云迁移、对象存储迁移。更多详情请参见对象存储迁移服务。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
支持的数据源 - 数据治理中心 DataArts Studio

整库同步支持的数据源类型整库同步适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线同步场景，不适用于在线实时同步。支持整库同步的数据源（已支持的数据源即可作为源端，又可作为目的端组成不同链路）如下所示：读取能力：DWS、RDS(MySQL)、RDS(PostgreSQL)

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
Import GES - 数据治理中心 DataArts Studio

是否离线导入，取值为是或者f否，默认取否。是：表示离线导入，导入速度较快，但导入过程中图处于锁定状态，不可读不可写。否：表示在线导入，相对离线导入，在线导入速度略慢，但导入过程中图并未锁定，可读不可写。重复边忽略Label 否重复边的定义，是否忽略Label。取值为是或者否，默认取是。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

Hive等多种数据仓库。支持可视化和DDL方式管理数据库表。数据管理脚本开发脚本开发功能提供如下能力：提供在线脚本编辑器，支持多人协作进行SQL、Shell等脚本在线代码开发和调测。支持使用变量和函数。支持脚本的版本管理能力。脚本开发作业开发作业开发功能提供如下能力：

帮助中心 > 数据治理中心 DataArts Studio > 功能总览
入门实践 - 数据治理中心 DataArts Studio

度CDM作业。通过数据开发实现数据增量迁移 DataArts Studio服务的DLF组件提供了一站式的大数据协同开发平台，借助DLF的在线脚本编辑、周期调度CDM的迁移作业，也可以实现增量数据迁移。本文以DWS导入到OBS为例，介绍DLF配合CDM实现增量迁移的流程通过CDM节点批量创建分表迁移作业

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门
注册API - 数据治理中心 DataArts Studio

数的场景。 API测试完成API参数的配置并保存后，单击左下角的“开始测试”，可进入API测试环节。填写参数值，单击“开始测试”，即可在线发送API请求，在右侧可以看到API请求详情及返回内容。测试过程中，如果数据服务API查询及返回数据的总时长超过默认60秒，会报超时错误。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
业务指标 - 数据治理中心 DataArts Studio

指标数据的刷新的最小频率。统计口径&修饰词除统计周期和维度外，该指标常用的统计口径&修饰词，限制指标数据的范围。指标应用场景描述该指标重要的应用场景，包括在线报表、例行报告、汇报材料等。备注在指标描述之外还需要补充的信息，有助于正确理解和使用该指标。度量对象衡量该指标的度量字段，如果不涉及可以不填写。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计
指标定义 - 数据治理中心 DataArts Studio

指标数据的刷新的最小频率统计口径&修饰词除统计周期和维度外，该指标常用的统计口径&修饰词，限制指标数据的范围。指标应用场景描述该指标重要的应用场景，包括在线报表、例行报告、汇报材料等。备注在指标描述之外还需要补充的信息，有助于正确理解和使用该指标。度量对象衡量该指标的度量字段，如果不涉及可以不填写。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标设计
新建数据对账作业 - 数据治理中心 DataArts Studio

当前系统支持“新建目录”和“同步主题为目录”两种方式：选择“新建目录”时，直接在目录处单击，输入目录名称，即可完成目录新建。直接新建目录的最大深度拓展为7层。图1 新建目录选择“同步主题为目录”时，在目录处单击，即可将数据架构处的主题同步到目录中（仅支持同步“已发布”状态的主题）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。数据集成支持整库迁移的数据源如表2所示。表2 整库迁移支持的数据源数据源分类数据源读取写入说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。数据集成支持整库迁移的数据源如表2所示。表2 整库迁移支持的数据源数据源分类数据源读取写入说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

整库迁移支持的数据源类型整库迁移适用于将本地数据中心或在ECS上自建的数据库，同步到云上的数据库服务或大数据服务中，适用于数据库离线迁移场景，不适用于在线实时迁移。数据集成支持整库迁移的数据源如表2所示。表2 整库迁移支持的数据源数据源分类数据源读取写入说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
配置方式生成API - 数据治理中心 DataArts Studio

图8 调整分页参数值完成API参数的配置并保存后，单击左下角的“开始测试”，可进入API测试环节。填写参数值，单击“开始测试”，即可在线发送API请求，在右侧可以看到API请求详情及返回内容。测试过程中，如果数据服务API查询及返回数据的总时长超过默认60秒，会报超时错误。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
新建数据质量作业 - 数据治理中心 DataArts Studio

当前系统支持“新建目录”和“同步主题为目录”两种方式：选择“新建目录”时，直接在目录处单击，输入目录名称，即可完成目录新建。直接新建目录的最大深度拓展为7层。图1 新建目录选择“同步主题为目录”时，在目录处单击，即可将数据架构处的主题同步到目录中（仅支持同步“已发布”状态的主题）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控

总条数： 42

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

配置脱敏策略 - 数据治理中心 DataArts Studio

配置MRS Hudi目的端参数 - 数据治理中心 DataArts Studio

数据库、数据仓库、数据湖与华为智能数据湖方案是什么，有哪些区别和联系？ - 数据治理中心 DataArts Studio

编排API简介 - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

入门实践 - 数据治理中心 DataArts Studio

注册API - 数据治理中心 DataArts Studio

业务指标 - 数据治理中心 DataArts Studio

指标定义 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

配置方式生成API - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线