-
Java - 数据治理中心 DataArts Studio
弹出“Import Projects”对话框。 图2 Import 单击“Browse”,在弹出的对话框中选择解压后的SDK路径。 图3 选择demo工程 单击“Finish”,完成工程导入。 最终工程目录结构如下: 图4 导入工程的目录结构 “Main.java”为示例代码,请根据实际情况修改
-
如何使用Java调用CDM的Rest API创建数据迁移作业? - 数据治理中心 DataArts Studio
如何使用Java调用CDM的Rest API创建数据迁移作业? CDM提供了Rest API,可以通过程序调用实现自动化的作业创建或执行控制。 这里以CDM迁移MySQL数据库的表city1的数据到DWS的表city2为例,介绍如何使用Java调用CDM服务的REST API创建、启动、查询、删除该CDM作业。
-
管理驱动 - 数据治理中心 DataArts Studio
驱动管理”,进入驱动管理页面上传驱动。 图1 上传驱动 方式一:单击对应驱动名称右侧操作列的“上传”,选择本地已下载的驱动。 方式二:单击对应驱动名称右侧操作列的“从sftp复制”,配置sftp连接器名称和驱动文件路径。 (可选)在驱动更新场景下,上传驱动后必须在CDM集群列表中重启集群才能更新生效。
-
数据服务SDK支持的语言? - 数据治理中心 DataArts Studio
数据服务SDK支持的语言? 数据服务SDK支持的语言有:C#、Python、Go、JavaScript、PHP、C++、C、Android、Java。 父主题: 数据服务
-
配置FTP/SFTP连接 - 数据治理中心 DataArts Studio
FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到数据库。 当前仅支持Linux操作系统的FTP 服务器。 作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户,密码不会立即生效且作业会运行失败。 连接FTP或SFTP服务器时,连接参数相同,如表1所示。
-
查看表 - 数据治理中心 DataArts Studio
关系模型页面默认显示为列表视图,单击列表右上方的“模型视图”按钮,切换为模型视图,如下图所示。单击“列表视图”则可以重新切换回列表视图。 图1 模型视图 在模型视图中支持以下功能: 双击表名,可显示表的详情信息。 单击左上角的“导出图片”按钮,可以将模型视图导出成图片。 在右上角的搜索框
-
基础操作符 - 数据治理中心 DataArts Studio
基础操作符 EL表达式支持大部分Java提供的算术和逻辑操作符。 操作符列表 表1 基础操作符 操作符 描述 . 访问一个Bean属性或者一个映射条目 [] 访问一个数组或者链表的元素 () 组织一个子表达式以改变优先级 + 加 - 减或负 * 乘 / 或 div 除 % 或 mod
-
SDK使用前准备 - 数据治理中心 DataArts Studio
SDK使用前准备 下载SDK,并导入对应SDK到本地开发工具。 登录DataArts Studio控制台。 单击“数据服务”模块。 单击左侧菜单“共享版> SDK”或“专享版 > SDK”。 单击SDK使用引导区域里对应语言的SDK,下载SDK包到本地。 进行SDK包完整性校验。Wind
-
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio
时可以使用正则表达式分隔。 正则表达式参数在源端作业参数中配置,要求源连接为对象存储或者文件系统,且“文件格式”必须选择“CSV格式”。 图1 正则表达式参数 在迁移CSV格式的文件时,CDM支持使用正则表达式分隔字段,并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关
-
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio
时可以使用正则表达式分隔。 正则表达式参数在源端作业参数中配置,要求源连接为对象存储或者文件系统,且“文件格式”必须选择“CSV格式”。 图1 正则表达式参数 在迁移CSV格式的文件时,CDM支持使用正则表达式分隔字段,并按照解析后的结果写入目的端。正则表达式语法请参考对应的相关
-
数据服务概览 - 数据治理中心 DataArts Studio
数据服务概览 DataArts Studio数据服务旨在为企业搭建统一的数据服务总线,帮助企业统一管理对内对外的API服务。数据服务为您提供快速将数据表生成数据API的能力,涵盖API发布、管理、运维的全生命周期管理,帮助您简单、快速、低成本、低风险地实现微服务聚合、前后端分离、
-
开发Python脚本 - 数据治理中心 DataArts Studio
支持设置脚本责任人 单击编辑器右侧的“脚本基本信息”,可设置脚本的责任人和描述信息。 脚本内容大小不能超过16MB。 企业模式下,支持从脚本开发界面快速前往发布。标放置在上,单击“前往发布”,进入待发布任务界面。 在编辑器上方,单击“运行”。Python语句运行完成后,在编辑器下方可以查看脚本的执行历史和执行结果。
-
配置主机连接 - 数据治理中心 DataArts Studio
担压力。 在调度Shell、Python脚本时,Agent会访问ECS主机,如果Shell、Python脚本的调度频率很高,ECS主机会将Agent的内网IP加入黑名单。为了保障作业的正常调度,强烈建议您使用ECS主机的root用户将绑定Agent(即CDM集群)的内网IP加到/etc/hosts
-
开发一个Python作业 - 数据治理中心 DataArts Studio
print(context2) 图3中的脚本开发区为临时调试区,关闭脚本页签后,开发区的内容将丢失。 主机连接:建立主机数据连接中创建的连接。 图3 编辑Python语句 单击“保存”,并提交版本。 单击“运行”执行Python语句。 查看脚本运行结果。 图4 查看脚本运行结果 在作业中引用Python脚本
-
OCR - 数据治理中心 DataArts Studio
OCR 功能 OCR节点支持识别图片上的文字信息, 识别结果将存储到用户指定的OBS目录下。 OCR节点仅支持在华北-北京四使用。 参数 用户可参考表1和表2配置OCR节点的参数。 表1 属性参数 参数 是否必选 说明 节点名称 是 节点名称,可以包含中文、英文字母、数字、“_”
-
开发Shell脚本 - 数据治理中心 DataArts Studio
支持设置脚本责任人 单击编辑器右侧的“脚本基本信息”,可设置脚本的责任人和描述信息。 脚本内容大小不能超过16MB。 企业模式下,支持从脚本开发界面快速前往发布。标放置在上,单击“前往发布”,进入待发布任务界面。 在编辑器上方,单击“运行”。Shell语句运行完成后,在编辑器下方可以查看脚本的执行历史和执行结果。
-
使用CDM上传数据到OBS - 数据治理中心 DataArts Studio
使用CDM上传数据到OBS 上传存量数据 上传增量数据 父主题: 案例:贸易数据统计与分析
-
上传存量数据 - 数据治理中心 DataArts Studio
> 连接管理 > 新建连接”,进入选择连接类型的界面,如图1所示。 图1 选择连接器类型 连接H公司本地的Apache Hadoop HDFS文件系统时,连接类型选择“Apache HDFS”,然后单击“下一步”。 图2 创建HDFS连接 名称:用户自定义连接名称,例如“hdfs_link”。
-
REST API SDK参考 - 数据治理中心 DataArts Studio
Studio服务的REST API SDK包和参考文档。 当前DataArts Studio服务的API Explorer接口和REST API SDK包支持如下组件: 数据集成(注册在云数据迁移CDM服务) 数据开发 管理中心 数据架构 数据质量 数据目录 数据服务 数据集成组件的API
-
如何使用CDM服务将MySQL的数据导出成SQL文件,然后上传到OBS桶? - 数据治理中心 DataArts Studio
如何使用CDM服务将MySQL的数据导出成SQL文件,然后上传到OBS桶? CDM服务暂不支持该操作,建议通过手动导出MySQL的数据文件,然后在服务器上开启SFTP服务,然后新建CDM作业,源端是SFTP协议,目的端是OBS,将文件传过去。 父主题: 数据集成