搜索_华为云

配置数据血缘 - 数据治理中心 DataArts Studio

在数据开发组件，进入“数据开发 > 作业开发”页签，单击需要手动配置血缘关系的作业名，打开作业画布。单击作业画布中的MRS Spark节点，并切换到“血缘关系”页签。图2 进入血缘关系页签在MRS Spark节点的“血缘关系”页签，手动配置血缘的输入表。假如MRS Spark作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

打开了JDBC连接器与关系型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开关；开源MySQL数据库支持useCursorFetch参数，无需对此参数进行设置。数据源认证及其他功能配置认证类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

打开了JDBC连接器与关系型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开关；开源MySQL数据库支持useCursorFetch参数，无需对此参数进行设置。 Hive JDBC连接串否连接Hive

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

addDays(Date date, int amount) 给date添加指定天数后，返回新Date对象，amount可以是负数。将作业调度计划减一天的时间，转换为年月日格式。 #{DateUtil.format(DateUtil.addDays(Job.planTime,-1),"yyyy-MM-dd")}

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

确保网络安全的同时，方便网络配置。 VPC、子网、安全组的详细操作，请参见《虚拟私有云用户指南》。说明：目前专享版集群创建完成后不支持切换VPC、子网、安全组，请谨慎选择。如果开启公网入口，安全组入方向需要放开80（HTTP）和443（HTTPS）端口的访问权限。此处支持

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
企业模式简介 - 数据治理中心 DataArts Studio

开发环境下，脚本、作业以当前开发者的身份执行；生产环境下，脚本、作业则使用空间级的公共IAM账号或公共委托执行。如果需要对生产环境进行变更，必须在开发环境通过开发者的发布操作才能将变更提交到生产环境，需要管理者或部署者审批通过，才能发布成功。劣势存在不稳定、不安全的风险。无法设置开发环境和生产环境隔离，只能进行简单的数据开发。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
创建企业模式工作空间 - 数据治理中心 DataArts Studio

e、DIS、ECS等），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。因此您需要准备两套数据湖服务，且两套数据湖服务的版本、规格、组件、区域、VPC、子网以及相关配置等信息，均应保持一致，详细操作请参见创建DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

支持DML：包括INSERT、UPDATE、DELETE。支持的DDL：新增列。不支持混合分区表。混合分区表中的外部分区数据变更不产生DML日志，增量数据同步时无法获取变更信息，会存在数据不一致的风险。表名和列名长度限制为30个字符。Oracle日志读取采用Oracle logmine

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
查询指定发布包详情 - 数据治理中心 DataArts Studio

提交人名称。 task_type 否 integer 任务类型。 1：作业 2：脚本 3：资源 update_type 否 integer 变更类型，默认值1。 1：新增 2：修改 3：删除表6 发布包审批信息的参数说明参数名是否必选参数类型说明 user_id 否 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

date_format(#col, time_format[, src_tz, dst_tz])：将源端col列按time_format格式化, 可选转换时区。 now([tz])：获取指定时区的当前时间。 if(cond_exp, str1, str2)：满足条件表达式cond_exp时返回str1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
管理配置中心 - 数据治理中心 DataArts Studio

有普通空间；普通空间可以查询、引用公共层空间的码表和数据标准，但无法进行新增、修改和删除的操作。当前空间转换为公共层空间后，不支持回退为普通空间，其他普通空间也不能再转换为公共层空间。请谨慎选择您的公共层空间。公共层空间无法反向查询、引用或操作普通空间的数据。时间限定生成使

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
CDM Job - 数据治理中心 DataArts Studio

选择待执行的CDM作业所属的CDM集群。此处支持勾选两个CDM集群，用于提升作业可靠性。勾选两个集群时，集群是随机下发，用于分担系统负荷。当其中一个集群状态异常后，会触发切换到另一个集群运行作业。勾选两个集群的场景下，“作业类型”不推荐选择“创建新作业”，应设置为“选择已存在的作业”，且确保两个集群下分别存在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
步骤3：数据集成 - 数据治理中心 DataArts Studio

说明： CDM集群和OBS桶不在同一个Region时，不支持跨Region访问OBS桶。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。 obs.myregion.mycloud.com 端口数据传输协议端口，https是443，http是80。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
约束与限制 - 数据治理中心 DataArts Studio

Z”，即“2018-08-08 08:08:08.888 +08:00”。迁移数据到云搜索服务时如果date字段的原始数据不满足格式要求，可以通过CDM的字段转换功能转换为上述格式。数据接入服务（DIS）和Kafka数据源约束消息体中的数据是一条类似CSV格式的记录，可以支持多种分隔符。不支持二进制格式或其他格式的消息内容解析。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

则可以通过level1.level2[1].level3取到数据”test”作为目标端某一个字段的值。 udf方法支持填写Flink的内置函数用于数据转换，例如： CONCAT(CAST(NOW() as STRING), `col_name`) DATE_FORMAT(NOW(), 'yy')

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
新建整库迁移作业 - 数据治理中心 DataArts Studio

才会记录脏数据。用户可以进入脏数据目录，查看作业执行过程中处理失败的数据或者被清洗过滤掉的数据，针对该数据可以查看源数据中哪些数据不符合转换、清洗规则。 /user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
支持的数据类型 - 数据治理中心 DataArts Studio

10g及以后的版本中允许存储最多（4GB）×（数据库块大小）字节的数据。CLOB包含要进行字符集转换的信息。这种数据类型很适合存储纯文本信息。 String 不支持 nclob 这种类型能够存储最多4GB的数据。当字符集发生转换时，这种类型会受到影响。不支持不支持 bfile 可以在数据库列中存储

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
新建原子指标 - 数据治理中心 DataArts Studio

原子指标的计算逻辑修改生效后，会直接更新应用于相关的衍生指标。原子指标删除英文名，需要校验下游是否有衍生指标使用，如果有，则无法删除。目前原子指标在被下游使用的情况下，支持变更英文名。原子指标的更改会影响下游衍生指标。约束与限制单工作空间允许创建的原子指标个数最多5000个。前提条件您已创建并发布事实表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
补数据场景使用介绍 - 数据治理中心 DataArts Studio

自动增加脚本参数DATE，脚本参数DATE的值支持使用EL表达式。如果是变量时间的话，需要使用DateUtil内嵌对象的表达式，平台会自动转换成历史日期。EL表达式用法可参考EL表达式。补数据作业除了支持作业参数，脚本参数或者全局环境变量也支持。约束条件只有数据开发作业配置了周期调度，才支持使用补数据功能。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
管理通知 - 数据治理中心 DataArts Studio

知列表中关闭通知任务。在数据开发主界面的左侧导航栏，选择“运维调度 > 通知管理”。选择“通知管理”页签。在通知的“开关”列，单击，切换成时，通知为关闭状态。图3 关闭通知查看通知记录用户可以在通知记录中查看所有的通知信息。在数据开发主界面的左侧导航栏，选择“运维调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理

总条数： 268

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置数据血缘 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

企业模式简介 - 数据治理中心 DataArts Studio

创建企业模式工作空间 - 数据治理中心 DataArts Studio

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

查询指定发布包详情 - 数据治理中心 DataArts Studio

MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

新建原子指标 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

管理通知 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线