搜索_华为云

MRS Spark SQL - 数据治理中心 DataArts Studio

MRS Spark SQL 功能通过MRS Spark SQL节点实现在MRS中执行预先定义的SparkSQL语句。参数用户可参考表1，表2和表3配置MRS Spark SQL节点的参数。表1 属性参数参数是否必选说明 MRS作业名称否 MRS的作业名称。如果未

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
API编排典型配置 - 数据治理中心 DataArts Studio

API编排典型配置 API编排的典型使用场景如下：对返回消息进行映射或格式转换：通过API编排的方式能够灵活实现消息映射及格式转换。数据请求依赖多个数据API：使用API编排后，可以降低调用次数，减少集成成本，提升调用效率。约束与限制仅3.0.6及以上版本的数据服务专享版集群支持API编排。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
开发并调度Import GES作业 - 数据治理中心 DataArts Studio

本章节介绍通过数据开发调用数据集成作业，将MySQL原始数据定期同步到OBS和MRS Hive中，并标准化为GES点/边数据集。然后基于标准化点/边数据集，自动生成图的元数据，实现最终将图数据（点数据集、边数据集和元数据）定期导入到GES服务中。图1 业务场景说明开发并调度Import GES作业假设MySQL

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

先设计概念模型，再进一步细化设计出逻辑模型，最后设计物理模型。物理模型：是在逻辑数据模型的基础上，考虑各种具体的技术实现因素，进行数据库体系结构设计，真正实现数据在数据库中的存放，例如：所选的数据仓库是DWS或DLI。维度建模维度建模是从分析决策的需求出发构建模型，它主要是

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据架构
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置OBS源端参数 - 数据治理中心 DataArts Studio

待迁移数据的目录，将迁移目录下的所有文件（包括所有嵌套子目录及其子文件）。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配合，可以实现定期同步新增数据，详细说明请参见使用时间宏变量完成增量同步。说明：如果配置了时间宏变量，通过DataArts Studio数据开发调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
ROMA FDI Job - 数据治理中心 DataArts Studio

ROMA FDI Job 功能通过ROMA FDI Job节点执行一个预先定义的ROMA Connect数据集成任务，实现源端到目标端的数据集成转换。原理该节点方便用户启动或者查询FDI任务是否正在运行。参数 ROMA FDI Job的参数配置，请参考以下内容：表1 属性参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
是否支持批量创建作业？ - 数据治理中心 DataArts Studio

解决方案 CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
ModelArts Train - 数据治理中心 DataArts Studio

ModelArts Train 功能通过编排ModelArts Train算子，实现在DataArts Studio中调度ModelArts工作流。前提条件已在ModelArts平台中完成工作空间的创建，具体请参考创建工作空间。已在ModelArts平台中完成工作流的创建，具体请参考创建工作流。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据治理各模块域之间的关系 - 数据治理中心 DataArts Studio

数据目录管理模块完成元数据的采集和注册，为数据应用和数据消费提供了解数据的窗口。数据服务管控实现在数据服务开发过程中服务标准、规范、要求和管理的落实，数据服务打通数据应用和数据消费的物理通道。数据安全在数据开发过程中完成数据安全的IT实现，以达成数据应用过程中安全管理规范的要求。以上工作的有效开展，离

 帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理框架
数据架构概述 - 数据治理中心 DataArts Studio

析决策。用户在关系建模过程中，可以从数仓规划去设计物理模型。物理模型：是在逻辑数据模型的基础上，考虑各种具体的技术实现因素，进行数据库体系结构设计，真正实现数据在数据库中的存放，例如：所选的数据仓库是DWS或MRS_Hive。维度建模维度建模是从分析决策的需求出发构建模型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase、Apache HBase）或者表格存储服务（CloudTable）的数据时，支持导出指定时间段内的数据，配合CDM的定时任务，可以实现HBase/CloudTable的增量迁移。如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase、Apache HBase）或者表格存储服务（CloudTable）的数据时，支持导出指定时间段内的数据，配合CDM的定时任务，可以实现HBase/CloudTable的增量迁移。如果配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
配置资源权限 - 数据治理中心 DataArts Studio

配置资源权限本章主要介绍如何通过资源权限创建权限策略到Ranger组件，实现MRS资源权限控制，从而降低企业数据信息安全风险。当前支持创建的权限策略如下：创建HDFS权限策略创建Hive访问权限策略创建Hive脱敏权限策略创建Hive行级过滤器权限策略创建HBase权限策略

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
如何备份CDM作业？ - 数据治理中心 DataArts Studio

问题描述如何备份CDM作业？解决方案用户可以先通过CDM的批量导出功能，把所有作业脚本保存到本地，在需要的时候再重新创建集群、重新导入作业，实现作业备份。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据服务简介 - 数据治理中心 DataArts Studio

风格API从而实现数据开放，适用于小批量数据的快速响应交互场景。如果为大量数据开放的场景，更适于通过数据共享交换或其他方案实现，这种情况下，建议您通过数据安全进行权限管控、敏感数据识别、数据脱敏、数据水印等手段保护数据安全。 API开放方使用流程您作为API提供者，需要实现一个或一组

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
用户已添加权限，还是无法查看工作空间？ - 数据治理中心 DataArts Studio

用户已添加权限，还是无法查看工作空间？可能原因 DataArts Studio基于DAYU系统角色+工作空间角色实现授权的能力。为使IAM用户权限正常，IAM用户所在的用户组需要在IAM控制台中被授予DAYU User或DAYU Administrator的系统角色，另外也必须确保DAYU

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

开发一个MRS Flink作业本章节介绍如何在数据开发模块上进行MRS Flink作业开发。场景说明本教程通过开发一个MRS Flink作业来实现统计单词的个数。前提条件具有OBS相关路径的访问权限。已开通MapReduce服务MRS，并创建MRS集群。数据准备下载Flink作业资源包"wordcount

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
步骤1：流程设计 - 数据治理中心 DataArts Studio

数据治理业务流程设计如图1所示，后续的数据治理操作均基于本业务流程完成。图1 流程设计需求分析通过需求分析，可以提炼出数据治理流程的实现框架，支撑具体数据治理实施流程的设计。在本示例场景下，当前面临的数据问题如下：未建立标准化模型数据字段命名不标准、不规范数据内容不标准，数据质量不可控

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
流程设计 - 数据治理中心 DataArts Studio

流程设计基于价值流产生，属于指标管理的流程处理模块，指导并规范需求的管理，确保业务需求受理、分析、交付等过程的高效运作；并聚焦高价值需求，实现业务价值最大化，支撑业务运作及目标的达成。数据指标流程设计首先需要基于明确的业务诉求，在明确业务需要统计的指标后，制定指标对应的数据信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标设计

总条数： 354

上一页
1
2
3
4
5
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark SQL - 数据治理中心 DataArts Studio

API编排典型配置 - 数据治理中心 DataArts Studio

开发并调度Import GES作业 - 数据治理中心 DataArts Studio

数据架构支持哪些数据建模方法？ - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

ROMA FDI Job - 数据治理中心 DataArts Studio

是否支持批量创建作业？ - 数据治理中心 DataArts Studio

ModelArts Train - 数据治理中心 DataArts Studio

数据治理各模块域之间的关系 - 数据治理中心 DataArts Studio

数据架构概述 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

HBase/CloudTable增量迁移 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

如何备份CDM作业？ - 数据治理中心 DataArts Studio

数据服务简介 - 数据治理中心 DataArts Studio

用户已添加权限，还是无法查看工作空间？ - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

流程设计 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线