搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置YASHAN源端参数 - 数据治理中心 DataArts Studio

配置YASHAN源端参数作业中源连接从YASHAN导出的数据时，源端作业参数如表1所示。表1 YASHAN作为源端时的作业参数参数类型参数名说明取值样例基本参数使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使用S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据架构概述 - 数据治理中心 DataArts Studio

数据架构概述模型设计方法概述根据业务需求抽取信息的主要特征，模拟和抽象出一个能够反映业务信息（对象）之间关联关系的模型，即数据模型。数据模型也是可视化的展现企业内部信息如何组织的蓝图。数据模型应满足三方面要求：能比较真实地模拟业务（场景）；容易被人所理解；便于在IT系统中实现。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

OBS数据迁移到DLI服务操作场景数据湖探索（Data Lake Insight，简称DLI）提供大数据查询服务，本章节介绍使用CDM将OBS的数据迁移到DLI，使用流程如下：创建CDM集群创建DLI连接创建OBS连接创建迁移作业前提条件已经开通了OBS和DLI，并且当前用户拥有OBS的读取权限。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务操作场景云搜索服务（Cloud Search Service）为用户提供结构化、非结构化文本的多条件检索、统计、报表，本章节介绍如何通过CDM将数据从Oracle迁移到云搜索服务中，流程如下：创建CDM集群并绑定EIP 创建云搜索服务连接创建Oracle连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

OBS数据迁移到云搜索服务操作场景 CDM支持在云上各服务之间相互迁移数据，本章节介绍如何通过CDM将数据从OBS迁移到云搜索服务中，流程如下：创建CDM集群创建云搜索服务连接创建OBS连接创建迁移作业前提条件已获取OBS的访问域名、端口，以及AK、SK。已经开通

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数仓规划 - 数据治理中心 DataArts Studio

数仓规划数仓规划，目前系统默认的数仓分层包含SDI、DWI、DWR、DM（Data Mart）等4层，支持用户自定义数仓分层。数仓规划对数仓分层以及数仓模型进行统一管理。关系建模下包含SDI层和DWI层两层模型，物理模型归属于两层模型之一。 SDI：Source Data I

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
创建MRS Hive连接器 - 数据治理中心 DataArts Studio

创建MRS Hive连接器 MRS Hive连接适用于MapReduce服务，本教程为您介绍如何创建MRS Hive连接器。前提条件已创建CDM集群。已获取MRS集群的Manager IP、管理员账号和密码，且该账号拥有数据导入、导出的操作权限。 MRS集群和CDM集群之间网络互通，网络互通需满足如下条件：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
DLI Spark - 数据治理中心 DataArts Studio

DLI Spark 功能通过DLI Spark节点执行一个预先定义的Spark作业。 DLI Spark节点的具体使用教程，请参见开发一个DLI Spark作业。参数用户可参考表1，表2和表3配置DLI Spark节点的参数。表1 属性参数参数是否必选说明节点名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业前提条件参见新建作业创建一个实时处理的单任务Flink Jar作业。配置MRS Flink Jar作业表1 配置MRS Flink Jar作业属性参数参数是否必选说明 Flink作业名称是输入Flink作业名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
关系建模 - 数据治理中心 DataArts Studio

关系建模物理模型是指按照一定规则和方法，将逻辑模型中所定义的实体、属性、属性约束、关系等要素转换为数据库软件所能够识别的表关系图(Table Relationship Diagram)的一种物理描述。在关系建模中，您可以新建SDI层和DWI层两个模型，模型最终是通过物理建模进

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
DLI Flink Job - 数据治理中心 DataArts Studio

DLI Flink Job 功能 DLI Flink Job节点用于创建和启动作业，或者查询DLI作业是否正在运行，实现实时流式大数据分析。 DLI Flink流式作业提交到DLI之后，若处于运行中的状态，则认为节点执行成功。若作业配置了周期调度，则会周期检查该Flink作业是否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据架构示例 - 数据治理中心 DataArts Studio

数据架构示例 DataArts Studio数据架构以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。本章节操作场景如下：对MRS Hive数据湖中的出租车出行数据进行数据模型设计。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 使用教程
文件格式介绍 - 数据治理中心 DataArts Studio

文件格式介绍在创建CDM作业时，有些场景下源端、目的端的作业参数中需要选择“文件格式”，这里分别介绍这几种文件格式的使用场景、子参数、公共参数、使用示例等。 CSV格式 JSON格式二进制格式文件格式的公共参数文件格式问题解决方法 CSV格式如果想要读取或写入某个CSV

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新建维度 - 数据治理中心 DataArts Studio

新建维度维度建模包含维度、维度表和事实表三个部分。维度是用于观察和分析业务数据的视角，支撑对数据汇聚、钻取、切片分析，用于SQL中的GROUP BY条件。维度多数具有层级结构，如：地理维度（其中包括国家、地区、省以及城市等级别的内容）、时间维度（其中包括年度、季度、月度等级别的内容）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
约束与限制 - 数据治理中心 DataArts Studio

约束与限制 CDM系统级限制和约束 DataArts Studio实例赠送的数据集成集群，由于规格限制，仅用于测试业务、数据连接代理场景。用于运行数据迁移作业的其他规格CDM集群可以在DataArts Studio控制台以增量包的形式购买，也可以在云数据迁移CDM服务控制台直接购买。二者差异体现在如下方面：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
文件格式介绍 - 数据治理中心 DataArts Studio

文件格式介绍在创建CDM作业时，有些场景下源端、目的端的作业参数中需要选择“文件格式”，这里分别介绍这几种文件格式的使用场景、子参数、公共参数、使用示例等。 CSV格式 JSON格式二进制格式文件格式的公共参数文件格式问题解决方法 CSV格式如果想要读取或写入某个CSV

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
步骤5：数据架构设计 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 DataArts Studio数据架构以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。 DataArts Studio数据架构建议的数据分层如下： SDI (Source

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程

总条数： 1142

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

配置YASHAN源端参数 - 数据治理中心 DataArts Studio

数据架构概述 - 数据治理中心 DataArts Studio

OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

数仓规划 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

创建MRS Hive连接器 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

开发实时处理单任务MRS Flink Jar作业 - 数据治理中心 DataArts Studio

关系建模 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

数据架构示例 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线