搜索_华为云

新建作业 - 数据治理中心 DataArts Studio

新建作业作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。开发作业前请先新建作业。前提条件作业在每个工作空间的最大配额为10000，作业目录最多5000个，目录层级最多为10层。请确保当前数量未达到最大配额。新建普通目录如果已存在可用的目录，则可以跳过当前操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
Loop内嵌对象 - 数据治理中心 DataArts Studio

Loop内嵌对象使用Loop内嵌对象可获取For Each节点数据集中的数据。属性表1 属性说明属性类型描述示例 dataArray String Loop.dataArray表示For Each节点“数据集”中定义的二维数组。一般定义格式为#{Loop.dataArray

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
批作业监控 - 数据治理中心 DataArts Studio

批作业监控批作业监控提供了对批处理作业的状态进行监控的能力。批处理作业支持作业级别的调度计划，可以定期处理批量数据，主要用于实时性要求低的场景。批作业是由一个或多个节点组成的流水线，以流水线作为一个整体被调度。被调度触发后，任务执行一段时间必须结束，即任务不能无限时间持续运行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
LTS数据连接参数说明 - 数据治理中心 DataArts Studio

LTS数据连接参数说明表1 LTS数据连接参数是否必选说明数据连接类型是 LTS连接固定选择为LTS。数据连接名称是数据连接的名称，只能包含字母、数字、下划线和中划线，且长度不超过100个字符。标签否标识数据连接的属性。设置标签后，便于统一管理。说明：标签的名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
查找维度表 - 数据治理中心 DataArts Studio

枚举值： HASH: 对指定的列进行Hash，通过映射，把数据分布到指定DN REPLICATION: 表的每一行存在所有数据节点（DN）中，即每个数据节点都有完整的表数据 distribute_column String DISTRIBUTE BY HASH column. quality_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度表接口
数据库部署在其他云 - 数据治理中心 DataArts Studio

数据库部署在其他云在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在其他云厂商场景下的网络打通方案。图1 网络示意图约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
配置入口API算子 - 数据治理中心 DataArts Studio

配置入口API算子入口API算子是API工作流的入口，工作流发布后可通过调用入口API来调用API工作流。在入口API算子内需定义API工作流的名称、URL、参数协议、请求方式、审核人、安全认证以及请求参数。表1 入口API算子参数说明 API名称入口API名称即API工作流名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
SDK使用前准备 - 数据治理中心 DataArts Studio

SDK使用前准备下载SDK，并导入对应SDK到本地开发工具。登录DataArts Studio控制台。单击“数据服务”模块。单击左侧菜单“共享版 > SDK”或“专享版 > SDK”。单击SDK使用引导区域里对应语言的SDK，下载SDK包到本地。进行SDK包完整性校验。

帮助中心 > 数据治理中心 DataArts Studio > SDK参考 > 数据服务SDK参考
通过云专线连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过云专线打通网络的方案。图1 网络示意图

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
通过VPN连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过VPN打通网络的方案。图1 网络示意图

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
通过云专线连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络本章节主要为您介绍数据库部署在其他云厂商场景下，通过云专线打通网络的方案。图1 网络示意图约束限制资源组为私网网段，不能与数据源网段重叠，否则会导致网络无法打通。资源组不具有公网网段，因此本方案仅能与数据源的私网连通。前提条件已购买资源组，详情请参见购买数据集成资源组

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
通过VPN连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络本章节主要为您介绍数据库部署在其他云厂商场景下的网络打通方案。图1 网络示意图约束限制资源组为私网网段，不能与数据源网段重叠，否则会导致网络无法打通。资源组不具有公网网段，因此本方案仅能与数据源的私网连通。前提条件已购买资源组，详情请参见购买数据集成资源组

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
复制作业 - 数据治理中心 DataArts Studio

复制作业本章节主要介绍如何复制一份作业。前提条件已完成作业开发。如何开发作业，请参见开发Pipeline作业。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
通过公网连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络本章节主要为您介绍数据库部署在其他云场景下，通过公网打通网络的方案。图1 网络示意图约束限制资源组不具有公网网段，只能通过公网NAT转换成固定的弹性公网IP访问公网，且该IP不能与数据源公网IP重复。前提条件已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
复制脚本 - 数据治理中心 DataArts Studio

复制脚本本章节主要介绍如何复制一个脚本。前提条件已完成脚本开发，请参见开发脚本。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > （可选）管理脚本
查询作业列表 - 数据治理中心 DataArts Studio

查询作业列表功能介绍查询批处理或实时作业列表，每次查询返回的作业数量上限是100。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 GET /v1/{project_id}/jobs?jobType={jobType}&offset=

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
查看汇总表详情 - 数据治理中心 DataArts Studio

枚举值： HASH: 对指定的列进行Hash，通过映射，把数据分布到指定DN REPLICATION: 表的每一行存在所有数据节点（DN）中，即每个数据节点都有完整的表数据 distribute_column String DISTRIBUTE BY HASH column. compression

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 汇总表接口
通过公网连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过公网打通网络的方案。图1 网络示意图约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
查找汇总表 - 数据治理中心 DataArts Studio

枚举值： HASH: 对指定的列进行Hash，通过映射，把数据分布到指定DN REPLICATION: 表的每一行存在所有数据节点（DN）中，即每个数据节点都有完整的表数据 distribute_column String DISTRIBUTE BY HASH column. compression

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 汇总表接口

总条数： 412

上一页
1
...
11
12
13
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建作业 - 数据治理中心 DataArts Studio

Loop内嵌对象 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

LTS数据连接参数说明 - 数据治理中心 DataArts Studio

查找维度表 - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

配置入口API算子 - 数据治理中心 DataArts Studio

SDK使用前准备 - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

复制作业 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

通过公网连通网络 - 数据治理中心 DataArts Studio

复制脚本 - 数据治理中心 DataArts Studio

查询作业列表 - 数据治理中心 DataArts Studio

查看汇总表详情 - 数据治理中心 DataArts Studio

通过公网连通网络 - 数据治理中心 DataArts Studio

查找汇总表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线