-
管理资源 - 数据治理中心 DataArts Studio
管理资源 用户可以通过资源管理功能,上传自定义代码或文本文件作为资源,在节点运行时调用。可调用资源的节点包含DLI Spark、MRS Spark、MRS MapReduce和DLI Flink Job。 创建资源后,配置资源关联的文件。在作业中可以直接引用资源。当资源文件变更,
-
如何查看CDM作业被哪些作业进行调用? - 数据治理中心 DataArts Studio
通过条件筛选,查询CDM作业的调度执行信息。 通过筛选“CDM作业”可以查询CDM作业的调度执行信息。 通过筛选“节点类型 > CDMJob”可以查询CDMJob节点算子的调度执行信息。 图1 批作业监控 父主题: 数据开发
-
数据目录如何可视化展示数据血缘? - 数据治理中心 DataArts Studio
数据目录如何可视化展示数据血缘? 数据血缘在数据目录中展示,首先要进行元数据采集,其次需要有相关的作业调度。 数据血缘方案请参见节点数据血缘。 父主题: 数据目录
-
数据管理流程 - 数据治理中心 DataArts Studio
单击可以查看数据连接目录树下的数据库、数据表以及字段信息。DWS SQL、DLI SQL、MRS Hive SQL、MRS Spark SQL代理模式均支持查看目录树,其他数据连接均不支持。 如果您在使用数据开发前,已创建了数据连接和对应的数据库和数据表,则可跳过数据管理操作,直接进入脚本开发或作业开发。
-
开发Pipeline作业 - 数据治理中心 DataArts Studio
拖动所需的节点至画布,鼠标移动到节点图标上,选中连线图标并拖动,连接到下一个节点上。 每个作业建议最多包含200个节点。 图1 编排作业 配置节点功能。右键单击画布中的节点图标,根据实际需要选择如表1所示的功能。 表1 右键节点功能 功能 说明 配置 进入该节点的“节点属性”页面。
-
实例监控 - 数据治理中心 DataArts Studio
手工重试 节点的状态为“失败”时,支持重新运行节点。 节点的状态为“运行异常”时,支持进行手工重试。 说明: 只有节点的“节点属性 > 高级 > 失败策略”设置为“挂起当前作业执行计划”时,才可以执行该操作。 强制成功 节点的状态为“失败”时,支持将该节点强制变更为“成功”状态,且实
-
查看日志时,系统提示“OBS日志文件不存在,请检查文件是否被删除或者没有OBS写入权限。”怎么办? - 数据治理中心 DataArts Studio
怎么办? 问题现象 查看数据开发的节点日志时,系统提示“OBS日志文件不存在,请检查文件是否被删除或者没有OBS写入权限”,如下图所示: 图1 提示信息 原因分析 数据开发的日志存储在OBS桶中,您所在的用户组没有OBS的操作权限,导致在查看节点日志时系统提示报错,或者OBS日志文件不存在时系统提示报错。
-
是否支持批量调度作业? - 数据治理中心 DataArts Studio
访问DataArts Studio服务的数据开发模块。 在数据开发主界面的左侧导航栏,选择“数据开发 > 作业开发”,新建作业。 拖动多个CDM Job节点至画布,然后再编排作业。 父主题: 数据集成
-
CDM是否支持参数或者变量? - 数据治理中心 DataArts Studio
CDM是否支持参数或者变量? 如果CDM作业使用了在数据开发时配置的作业参数或者变量,则后续在DataArts Studio数据开发模块调度此节点,可以间接实现CDM作业根据参数变量进行数据迁移。 父主题: 数据集成
-
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio
ql”。 图2 创建job_hive_sql作业 然后进入到作业开发页面,拖动MRS Hive SQL节点到画布中并单击,配置节点的属性。 图3 配置MRS Hive SQL节点属性 关键属性说明: SQL脚本:关联开发Hive SQL脚本中开发完成的Hive SQL脚本“hive_sql”。
-
调度作业 - 数据治理中心 DataArts Studio
系统默认“不选择任务组”。 任务组配置好后,可以更细粒度的进行当前任务组中的作业节点的并发数控制,比如作业中包含多个节点、补数据、重跑等场景。 举例1:任务组里面最大并发数配置为2,作业节点有5个,当作业运行时,只有2个节点在运行中,其它节点在等待运行。 举例2:任务组里面最大并发数配置为2,补数据的
-
SDK调用常见错误码/错误信息 - 数据治理中心 DataArts Studio
签名具有一定的有效期,当前签名已过期,请重新生成签名。 请确认本地时间和实际时间是否一致。 如果本地时间是准确的,请联系相关人员确认集群节点时间,可能节点时间存在异常。 401 Verify authroization failed. 签名校验失败 请确认进行签名的所有参数,均已上传且
-
文件格式介绍 - 数据治理中心 DataArts Studio
1000001, "max_score" : 1.0 }] 记录节点 记录数据的根节点。该节点对应的数据为JSON数组,CDM会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割。 从JSON文件复制数据 示例一 从行分隔/串连的多个对象中提取
-
状态码 - 数据治理中心 DataArts Studio
服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。
-
通过DataArts Studio调度大数据服务时需要注意什么? - 数据治理中心 DataArts Studio
失败。 如果您需要对大数据服务数据表进行读表和写表操作,建议参考以下方式之一进行串行操作处理: 将读表和写表操作拆分为同一作业的不同节点,两个节点通过连线建立先后执行关系,避免同时执行冲突。 将读表和写表操作拆分为两个不同的作业,两个作业之间设置依赖关系,避免同时执行冲突。 父主题:
-
源端为对象存储 - 数据治理中心 DataArts Studio
jsonReferenceNode 否 String 记录节点,当文件格式为“JSON_FILE”时此参数有效。对该JSON节点下的数据进行解析,如果该节点对应的数据为JSON数组,那么系统会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分割,例如:“data.list”。
-
数据开发 - 数据治理中心 DataArts Studio
因? 数据开发节点运行中报TOKEN不合法? 作业开发时,测试运行后如何查看运行日志? 月周期的作业依赖天周期的作业,为什么天周期作业还未跑完,月周期的作业已经开始运行? 执行DLI脚本,报Invalid authentication怎么办? 创建数据连接时,在代理模式下为什么选不到需要的CDM集群?
-
配置ORACLE数据连接 - 数据治理中心 DataArts Studio
CDM集群提供了DataArts Studio与非全托管服务通信的代理,所以创建Oracle的数据连接时,请选择一个CDM集群。如果没有可用的CDM集群,请先通过数据集成增量包进行创建。 CDM集群作为网络代理,必须和Oracle网络互通才可以成功创建Oracle连接。 说明:
-
启用细粒度认证 - 数据治理中心 DataArts Studio
考查看DWS集群guest agent版本。 MRS Hive连接或MRS SPARK连接中的用户是否配置了代理权限,若没配置代理,可参考参考:为MRS数据连接用户配置代理权限。 MRS SPARK数据连接对应的SPARK2x组件是否为多主实例模式。多主实例模式时才支持细粒度认证
-
创建连接(待下线) - 数据治理中心 DataArts Studio
agent :通过代理连接。 direct :直接连接。 userName 否 String MRS集群的用户名,通过代理连接的时候,是必选项。 password 否 String MRS集群的访问密码,通过代理连接的时候,是必选项。 agentName 否 String 连接代理,即CD