-
约束与限制 - 数据治理中心 DataArts Studio
使用CDM服务迁移数据到DLI时,当前用户需拥有OBS的读取权限。 目的端为DLI数据源时,抽取并发数建议配置为1,否则可能会导致写入失败。 Oracle数据源约束 不支持Oracle实时增量数据同步。 分布式缓存服务(DCS)和Redis数据源约束 第三方云的Redis服务无法支持
-
什么是数据治理中心DataArts Studio - 数据治理中心 DataArts Studio
提供企业级的元数据管理,厘清信息资产。通过数据地图,实现数据血缘和数据全景可视,提供数据智能搜索和运营监控。 数据服务 数据服务定位于标准化的数据服务平台,提供一站式数据服务开发、测试部署能力,实现数据服务敏捷响应,降低数据获取难度,提升数据消费体验和效率,最终实现数据资产的变现。 数据安全 数据安
-
步骤2:准备工作 - 数据治理中心 DataArts Studio
Studio前,您需要根据业务场景选择符合需求的云服务或数据库作为数据湖底座,由数据湖底座提供存储和计算的能力,DataArts Studio基于数据湖底座进行一站式数据开发、治理和服务。 DataArts Studio平台支持对接如DLI、DWS、MRS Hive等云服务,也支持对接如MySQL、O
-
配置HDFS源端参数 - 数据治理中心 DataArts Studio
Parquet格式:以Parquet格式解析源文件,用于HDFS数据导到表的场景。 CSV格式 列表文件 当“文件格式”选择为“二进制格式”时,才有该参数。 打开列表文件功能时,支持读取OBS桶中文件(如txt文件)的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径(不支持目录),文件内容示例如下:
-
计费说明 - 数据治理中心 DataArts Studio
数据服务专享集群增量包 数据服务专享集群增量包对应数据服务专享版集群。 数据服务定位于标准化的数据服务平台,提供一站式数据服务开发、测试部署能力,实现数据服务敏捷响应,降低数据获取难度,提升数据消费体验和效率,最终实现数据资产的变现。数据服务当前提供共享版与专享版两种服务方式,
-
导出导入脚本 - 数据治理中心 DataArts Studio
勾选需要导出的脚本,单击 > 导出脚本。导出完成后,即可通过浏览器下载地址,获取到导出的zip文件。 图1 选择并导出脚本 在弹出的“导出脚本”界面,选择需要导出的脚本的状态,单击“确定”。 图2 导出脚本 导入脚本 导入脚本功能依赖于OBS服务,如无OBS服务,可从本地导入。 您可以在脚本目录中导入一
-
新建整库迁移作业 - 数据治理中心 DataArts Studio
的权限。 ddsdb 查询筛选 创建用于匹配文档的筛选器。 例如:{HTTPStatusCode:{$gt:"400",$lt:"500"},HTTPMethod:"GET"}。 - 配置目的端作业参数,根据待导入数据的云服务配置对应参数,如表2所示。 表2 目的端作业参数 目的端数据库类型
-
DataArtsStudio实例一键购买接口 - 数据治理中心 DataArts Studio
用户的token 表3 请求Body参数 参数 是否必选 参数类型 描述 region_id 是 String 通过调用ManageOne平台的IAM服务的“查询区域列表”接口获取响应消息中的区域ID。 commodity_id 否 String 订单Id product_id 否 String
-
调度作业 - 数据治理中心 DataArts Studio
月:支持在一月中选择一天或多天的某一时刻开始调度运行。同时系统支持可以选择“每月最后一天”进行业务调度。 说明: 因为DataArts Studio不支持底层服务(例如,以前的CDM、DLI等服务)的补数据实例和周期调度作业实例并发运行,为了保证补数据实例不影响周期调度作业实例运行,两种类型作业实例不会抢占并发,所以
-
配置MRS Doris数据连接 - 数据治理中心 DataArts Studio
通过KMS加解密数据源认证信息,选择KMS中已创建的密钥。 绑定Agent 是 MRS为非全托管服务,DataArts Studio无法直接与非全托管服务进行连接。CDM集群提供了DataArts Studio与非全托管服务通信的代理,所以创建MRS的数据连接时,请选择一个CDM集群。如果没有可用的CDM集群,请先进行创建。
-
导出导入作业 - 数据治理中心 DataArts Studio
导出完成后,即可通过浏览器下载地址,获取到导出的zip文件。 图1 选择并导出作业 在弹出的“导出作业”界面,选择需要导出的作业范围和状态,单击“确定”,可以在下载中心查看导入结果。 图2 导出作业 导入作业 导入作业功能依赖于OBS服务,如无OBS服务,可从本地导入。 从OBS
-
入门实践 - 数据治理中心 DataArts Studio
件资源,实现IT应用全面服务化、云化,CDM(Cloud Data Migration,简称CDM)助力H公司做到代码“0”改动、数据“0”丢失迁移上云。 案例:搭建实时报警平台 在本实践用户可以了解到如何搭建一个简单的实时报警平台,该平台将应用多个云服务,结合数据开发模块的作业编辑和作业调度功能来实现。
-
For Each节点使用介绍 - 数据治理中心 DataArts Studio
创建DLI表。您可以在DataArts Studio数据开发中,新建DLI SQL脚本执行以下SQL命令,也可以在数据湖探索(DLI)服务控制台中的SQL编辑器中执行以下SQL命令: /* 创建数据表 */ CREATE TABLE a_new (name STRING, score INT)
-
开发实时处理单任务Flink SQL作业 - 数据治理中心 DataArts Studio
data; (可选)在编辑器上方,单击“格式化”,格式化SQL语句。 在编辑器上方,单击“语法检查”,可以对SQL语句进行语义校验。 在编辑器上方,单击,保存该作业并进行提交。 配置作业参数 作业参数为全局参数,可用于作业中的任意节点。操作方法如下: 单击编辑器右侧的“参数”,展开配置页面,配置如表4所示的参数。
-
For Each节点使用介绍 - 数据治理中心 DataArts Studio
创建DLI表。您可以在DataArts Studio数据开发中,新建DLI SQL脚本执行以下SQL命令,也可以在数据湖探索(DLI)服务控制台中的SQL编辑器中执行以下SQL命令: /* 创建数据表 */ CREATE TABLE a_new (name STRING, score INT)
-
实例监控 - 数据治理中心 DataArts Studio
选中时,该作业实例及其上下游实例的背景颜色加深显示。 DAG视图右下角展示该实例的概要信息,且实例名称和实例ID支持直接复制。 单击概览信息的“展开详情”打开详情面板,详情面板包含实例属性、作业参数、节点列表、历史实例等信息,支持调整高度并关闭详情面板。 单击空白处,即可取消选中效果。 右键单击
-
配置OBS源端参数 - 数据治理中心 DataArts Studio
JSON格式:以JSON格式解析源文件,一般都是用于迁移文件到数据表的场景。 CSV格式 列表文件 当“文件格式”选择为“二进制格式”时,才有该参数。 打开列表文件功能时,支持读取OBS桶中文件(如txt文件)的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径(不支持目录),例如直接写为如下内容:
-
权限治理使用流程 - 数据治理中心 DataArts Studio
您可通过图1了解统一权限治理的使用流程。 图1 统一权限治理使用流程图 统一权限治理支持数据权限管控、服务资源管控和Ranger权限管理,流程介绍如下: 数据权限管控流程 授权dlg_agency委托 由于数据安全使用委托时,所需的云服务权限更高。因此在使用数据安全前,需要提前为dlg_agency委托授予相关权限。
-
元数据实时同步接口(邀测) - 数据治理中心 DataArts Studio
AddColumnEvent添加字段 DropColumnEvent删除字段 AlterTriggerEvent修改触发器 AddTriggerEvent 添加触发器 DropTriggerEvent删除触发器 枚举值: AddForeignKeyEvent AddNotNullConstraintEvent
-
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio
映射为一张数据库表,并提供简单的SQL查询功能;可以将SQL语句转换为MapReduce任务进行运行。 环境准备 已开通MapReduce服务MRS,并创建MRS集群,为Hive SQL提供运行环境。 MRS集群创建时,组件要包含Hive。 已开通数据集成CDM,并创建CDM集群