检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建数据集成作业 本章节将介绍如何创建DataArts Studio数据集成作业。 本例中,需要创建如下三类集成作业: OBS到MySQL迁移作业:为方便演示,需要将OBS中的CSV格式的样例数据导入到MySQL数据库中。 MySQL到OBS迁移作业:正式业务流程中,需要将MyS
参数 参数类型 描述 id String 汇总表的唯一系统ID,更新时必填,创建时不须填写,ID字符串。 tb_name String 汇总表英文名称,对应实际的物理表名。 tb_logic_name String 汇总表的中文名,用于展示使用。 l1_id String 主题域分组
MySQL同步到MRS Hudi作业配置 支持的源端和目的端数据库版本 表1 支持的数据库版本 源端数据库 目的端数据库 MySQL数据库(5.6、5.7、8.x版本) MRS集群(3.2.0-LTS.x、3.5.x) Hudi版本(0.11.0) 数据库账号权限要求 在使用Mi
subject_area_group_name String 主题域分组名称。 subject_area_group_name_en String 主题域分组英文名称。 subject_area_group_guid String 主题域分组的guid。 ordinal Integer 主题域分组序号。
business_catalog_name String 业务资产名称。 business_catalog_name_eng String 业务资产英文名称。 level String 业务资产级别。 qualified_name String 业务资产级唯一限定名称。 ordinal Integer
配置FTP/SFTP源端参数 表1 FTP/SFTP作为源端时的作业参数 参数类型 参数名 说明 取值样例 基本参数 源目录或文件 要传输的目录或单个文件路径。 FROM_DIRECTORY/ or FROM_DIRECTORY/example.csv 文件格式 传输数据时使用的格式。
验。 X-Language 否 String 默认值:en-us 可选,导入导出接口必填,可选值有:zh-cn、en-us,分别表示中文、英文。 表4 FormData参数 参数 是否必选 参数类型 描述 file 是 File 导入用的excel文件,大小必须小于4MB,且行数小于3000行。
schedule_interval String 调度间隔,当调度周期为分钟、小时、天时,间隔时间为数字,而当调度周期为周时,调度间隔为星期的英文,如:每周一、周二调度时,schedule_interval为"MONDAY,TUESDAY"。 create_time Long 创建时间,13位时间戳(精确到毫秒)。
schedule_interval String 调度间隔,当调度周期为分钟、小时、天时,间隔时间为数字,而当调度周期为周时,调度间隔为星期的英文,如:每周一、周二调度时,schedule_interval为"MONDAY,TUESDAY"。 create_time Long 创建时间,13位时间戳(精确到毫秒)。
参数类型 描述 id 否 String 汇总表的唯一系统ID,更新时必填,创建时不须填写,ID字符串。 tb_name 是 String 汇总表英文名称,对应实际的物理表名。 tb_logic_name 是 String 汇总表的中文名,用于展示使用。 l2_id 否 String 主题域ID,只读,创建和更新时无需填写。
r_by的值填写形式为“排序参数参数名:ASC”或“排序参数参数名:DESC”,其中ASC表示升序,DESC表示降序,多个排序参数描述以“英文分号”进行分隔。 图7 排序参数设置 对于pre_order_by的值,您可以进行如下修改: 删掉某可选的排序参数,则此排序参数不再参与排序。
CompoundMetricVO 参数 参数类型 描述 id String 复合指标ID,ID字符串。更新时必填。 name_en String 复合指标英文名称。 name_ch String 复合指标名称。 description String 描述 dimension_group String
大对象(BLOB) OTHER: 其它类型 data_type_extend String 数据类型扩展字段。 name_en String 英文名。 name_ch String 中文名。 not_null Boolean 是否不为空。 attribute_type String 业务实体类型。
通过CDM节点批量创建分表迁移作业 适用场景 业务系统中,数据源往往会采用分表的形式,以减少单表大小,支持复杂的业务应用场景。 在这种情况下,通过CDM进行数据集成时,需要针对每张表创建一个数据迁移作业。您可以参考本教程,通过数据开发模块的For Each节点和CDM节点,配合作业参数,实现批量创建分表迁移作业。
配置HDFS目的端参数 作业中目的连接为HDFS连接时,目的端作业参数如表1所示。 表1 HDFS作为目的端时的作业参数 参数名 说明 取值样例 写入目录 写入数据到HDFS服务器的目录。 该参数支持配置为时间宏变量,且一个路径名中可以有多个宏定义变量。使用时间宏变量和定时任务配
MySQL同步到DWS作业配置 支持的源端和目的端数据库版本 表1 支持的数据库版本 源端数据库 目的端数据库 MySQL数据库(5.6、5.7、8.x版本) DWS集群(8.1.3、8.2.0版本) 数据库账号权限要求 在使用Migration进行同步时,源端和目的端所使用的数
For Each节点使用介绍 适用场景 当您进行作业开发时,如果某些任务的参数有差异、但处理逻辑全部一致,在这种情况下您可以通过For Each节点避免重复开发作业。 For Each节点可指定一个子作业循环执行,并通过数据集对子作业中的参数进行循环替换。关键参数如下: 子作业:选择需要循环执行的作业。
创建并管理工作空间 购买DataArts Studio实例的用户,系统将默认为其创建一个默认的工作空间“default”,并赋予该用户为管理员角色。您可以使用默认的工作空间,也可以参考本章节的内容创建一个新的工作空间。 DataArts Studio实例内的工作空间作为成员管理、
项目ID,获取方式参考接口路径参数“project_id”。 name_ch String 业务中文名。 name_en String 业务英文名。 biz_id String 业务ID,ID字符串。 biz_type String 业务实体类型。 枚举值: AGGREGATION_LOGIC_TABLE:
编号,ID字符串。 level Integer 层级。取值范围为1-7。 name_ch String 中文名称。 name_en String 英文名称。 状态码:400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码,如DS.6000,请求处理失败。