搜索_华为云

创建企业模式工作空间 - 数据治理中心 DataArts Studio

环境。配置两套数据湖服务，进行开发与生产环境隔离。对于集群化的数据源（例如MRS、DWS、RDS、MySQL、Oracle、DIS、ECS等），DataArts Studio通过管理中心的创建数据连接区分开发环境和生产环境的数据湖服务，在开发和生产流程中自动切换对应的数据湖。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > （可选）升级企业模式工作空间
导出导入脚本 - 数据治理中心 DataArts Studio

导出导入脚本导出脚本您可以在脚本目录中导出一个或多个脚本文件，导出的为开发态最新的已保存内容。参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
MRS MapReduce - 数据治理中心 DataArts Studio

_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。 MRS集群名是选择MRS集群。如需新建集群，请参考以下方法：单击，进入“集群列表”页面新建MRS集群。前往MRS管理控制台进行新建。 MapReduce作业名称是 MRS作业名称，只能由英文

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
查询告警通知记录 - 数据治理中心 DataArts Studio

{offset} 参数说明表1 URI参数说明参数名是否必选参数类型说明 project_id 是 String 项目编号，获取方法请参见项目ID和账号ID。 start_time 否 Long 告警的开始时间，默认当前时间的前一个小时，13位时间戳。 end_time

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
Data Migration - 数据治理中心 DataArts Studio

框右侧的。系统最多允许选择16个集群。 CDM作业消息体是输入CDM作业消息体，作业消息体内容为JSON格式。消息体JSON内容获取方法如下：参考新建离线处理集成作业创建一个单任务数据迁移作业。在键盘上按F12，打开创建好的单任务数据迁移作业，选择“network”页签

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
初始化数据标准模板 - 数据治理中心 DataArts Studio

初始化数据标准模板。调用方法请参见如何调用API。 URI POST /v2/{project_id}/design/standards/templates/action 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 数据标准模板接口
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
实时作业概述 - 数据治理中心 DataArts Studio

支持多种数据源链路组合，您可以将多种输入及输出数据源搭配组成同步链路进行数据同步。详情请参见支持的数据源。复杂网络环境下的数据同步支持云数据库、本地IDC、ECS自建数据库等多种环境下的数据同步。在配置同步任务前，您可以根据数据库所在网络环境，选择合适的同步解决方案来确保数据集成资源组与您将同步的数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

源表字段源表中的任一字段。配置附加字段的取值来源于源表字段时，请注意任务运行过程中不能修改对应源表字段的名称，否则可能导致作业异常。 udf方法 substring(#col, pos[, len])：截取源端col列的子串, 范围在[pos, pos+len)。 date_format(#col

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
更新规则模板 - 数据治理中心 DataArts Studio

更新规则模板调用方法请参见如何调用API。 URI PUT /v2/{project_id}/quality/rule-templates/{id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 规则模板接口
文件增量迁移 - 数据治理中心 DataArts Studio

配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。时间过滤参数位置：在创建表/文件迁移作业时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍
查询作业列表 - 数据治理中心 DataArts Studio

obName}&tags={tags} 参数说明参数名是否必选参数类型说明 project_id 是 String 项目编号，获取方法请参见项目ID和账号ID。 jobType 否 String 作业类型： REAL_TIME：实时处理 BATCH：批处理默认值：BATCH

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
查询实例运行状态 - 数据治理中心 DataArts Studio

ry_days} 参数说明表1 URI参数说明参数名是否必选参数类型说明 project_id 是 String 项目编号，获取方法请参见项目ID和账号ID。 is_own 否 String 是否查询当前用户的实例，默认为false，表示查询全部用户实例，为true时，表示查询当前用户的实例。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
文件增量迁移 - 数据治理中心 DataArts Studio

配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增量迁移场景下，“路径过滤器”的使用方法同“文件过滤器”一样，需要路径名称里带有时间字段，这样可以定期增量同步指定目录下的所有文件。时间过滤参数位置：在创建表/文件迁移作业时

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
获取质量作业列表V1 - 数据治理中心 DataArts Studio

批量查询数据质量作业，返回质量作业列表。调用方法请参见如何调用API。 URI GET /v1/{project_id}/quality/rules 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。表2 Query参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量作业接口
配置HDFS源端参数 - 数据治理中心 DataArts Studio

任务会立即失败。单位：秒。 60 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。 - 目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置HDFS源端参数 - 数据治理中心 DataArts Studio

等待时间”中配置。 ok.txt 过滤类型满足过滤条件的路径或文件会被传输，该参数有“无”、“通配符”和“正则表达式”三种选择。具体使用方法可参见文件增量迁移。 - 目录过滤器 “过滤类型”选择“通配符”、“正则表达式”时，用通配符过滤目录，符合过滤器规则的目录，允许进行迁移。支持配置多个路径，中间使用“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

源表字段源表中的任一字段。配置附加字段的取值来源于源表字段时，请注意任务运行过程中不能修改对应源表字段的名称，否则可能导致作业异常。 udf方法 substring(#col, pos[, len])：截取源端col列的子串, 范围在[pos, pos+len)。 date_format(#col

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
DLI连接参数说明 - 数据治理中心 DataArts Studio

DLI连接参数说明连接数据湖探索（DLI）服务时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
RDS数据连接参数说明 - 数据治理中心 DataArts Studio

RDS数据连接参数说明 RDS数据连接支持连接MySQL、PostgreSQL、SQL Server等数据库。表1 RDS数据连接参数是否必选说明数据连接类型是 RDS连接固定选择为RDS。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数

总条数： 824

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建企业模式工作空间 - 数据治理中心 DataArts Studio

导出导入脚本 - 数据治理中心 DataArts Studio

MRS MapReduce - 数据治理中心 DataArts Studio

查询告警通知记录 - 数据治理中心 DataArts Studio

Data Migration - 数据治理中心 DataArts Studio

初始化数据标准模板 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

实时作业概述 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

更新规则模板 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

查询作业列表 - 数据治理中心 DataArts Studio

查询实例运行状态 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

获取质量作业列表V1 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

DLI连接参数说明 - 数据治理中心 DataArts Studio

RDS数据连接参数说明 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线