搜索_华为云

配置元数据采集任务 - 数据治理中心 DataArts Studio

配置元数据采集任务本章主要介绍如何通过配置元数据采集策略新建采集任务，不同类型的数据源对应的采集策略不尽相同。元数据管理依据采集任务的配置策略，采集对应的技术元数据信息。约束与限制当元数据采集任务未指定采集范围时，默认采集该数据连接下的所有数据表/文件。采集任务运行完成后，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
实时作业监控 - 数据治理中心 DataArts Studio

实时作业监控实时作业监控提供了对实时处理作业的状态进行监控的能力。实时处理作业处理实时的连续数据，主要用于实时性要求高的场景。实时作业是由一个或多个节点组成的流水线，每个节点配置独立的、节点级别的调度策略，而且节点启动的任务可以永不下线。在实时作业里，带箭头的连线仅代表业务上

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
导入导出 - 数据治理中心 DataArts Studio

导入导出数据架构支持流程、主题、码表、数据标准、关系建模表（物理表）、逻辑实体、维度建模维度/事实表、业务指标、技术指标、数据集市汇总表的导入导出，暂不支持时间限定、审核中心和配置中心数据的导入导出。本例中以导入和导出关系建模表为例说明如何进行导入导出，其他数据操作类似。如果

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
权限治理使用流程 - 数据治理中心 DataArts Studio

权限治理使用流程统一权限治理提供了对于MRS、DWS、DLI数据湖仓中的库、表、字段的访问权限配置的核心能力，包含如下特性：集中式访问控制融合了不同的大数据服务进行统一权限管理，如MRS、DWS、DLI等，给用户带来了统一的权限配置入口，极大的提高了易用性和可维护性。多级权限配置模型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
修改作业 - 数据治理中心 DataArts Studio

修改作业功能介绍修改作业接口。调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clusters/{cluster_id}/cdm/job/{job_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数支持使用CSV、CarbonData或二进制格式批量传输大量文件到OBS。表1 OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。 bucket_2 写入目录写入数据到OBS服务器的目录，目录前面不加“/”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数作业中目的连接为OBS连接时，即导入数据到云服务OBS时，目的端作业参数如表1所示。高级属性里的参数为可选参数，默认隐藏，单击界面上的“显示高级属性”后显示。表1 OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
更新数据连接信息 - 数据治理中心 DataArts Studio

更新数据连接信息功能介绍更新数据连接信息。调用方法请参见如何调用API。 URI PUT /v1/{project_id}/data-connections/{data_connection_id} 表1 路径参数参数是否必选参数类型描述 data_connection_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据连接管理
创建数据连接 - 数据治理中心 DataArts Studio

创建数据连接功能介绍创建数据连接。调用方法请参见如何调用API。 URI POST /v1/{project_id}/data-connections 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据连接管理
测试创建数据连接 - 数据治理中心 DataArts Studio

测试创建数据连接功能介绍测试创建数据连接。调用方法请参见如何调用API。 URI POST /v1/{project_id}/data-connections/validation 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 管理中心API > 数据连接管理
随机集群创建作业并执行 - 数据治理中心 DataArts Studio

随机集群创建作业并执行功能介绍随机集群创建作业并执行接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/job 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

配置CDM作业字段映射操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
管理脱敏算法 - 数据治理中心 DataArts Studio

管理脱敏算法为了方便对数据进行脱敏，在创建脱敏策略前，需要您准备好脱敏算法。当前系统已内置20+脱敏算法，如果内置算法可以满足您的需求，您需要提前配置对应算法参数；否则，您可以新建脱敏算法。本章主要介绍内置脱敏算法，和如何新建脱敏算法。约束与限制新建随机脱敏或字符替换类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
产出信息(邀测) - 数据治理中心 DataArts Studio

产出信息(邀测) 功能介绍查询表相关的作业算子运行实例信息，该接口功能处于邀测阶段，后续将随功能公测将逐步开放。调用方法请参见如何调用API。 URI GET /v1/{project_id}/datamap/node/{task_id}/instances 表1 路径参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据目录API > 数据地图接口
数据架构示例 - 数据治理中心 DataArts Studio

数据架构示例 DataArts Studio数据架构以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。本章节操作场景如下：对MRS Hive数据湖中的出租车出行数据进行数据模型设计。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 使用教程
批作业监控 - 数据治理中心 DataArts Studio

批作业监控批作业监控提供了对批处理作业的状态进行监控的能力。批处理作业支持作业级别的调度计划，可以定期处理批量数据，主要用于实时性要求低的场景。批作业是由一个或多个节点组成的流水线，以流水线作为一个整体被调度。被调度触发后，任务执行一段时间必须结束，即任务不能无限时间持续运行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
步骤5：数据架构设计 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 DataArts Studio数据架构以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。 DataArts Studio数据架构建议的数据分层如下： SDI (Source

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 540

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置元数据采集任务 - 数据治理中心 DataArts Studio

实时作业监控 - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

权限治理使用流程 - 数据治理中心 DataArts Studio

修改作业 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

更新数据连接信息 - 数据治理中心 DataArts Studio

创建数据连接 - 数据治理中心 DataArts Studio

测试创建数据连接 - 数据治理中心 DataArts Studio

随机集群创建作业并执行 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

管理脱敏算法 - 数据治理中心 DataArts Studio

产出信息(邀测) - 数据治理中心 DataArts Studio

数据架构示例 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线