搜索_华为云

新建数据标准 - 数据治理中心 DataArts Studio

超过5层），五级之后的主题不做处理。同步后的目录数量不能超过配额（一般是500），否则系统将报错提示并取消同步操作。每次同步之前系统会自动检测数据标准的目录是否有空目录（该目录及其子目录下没有数据标准），有空目录则进行删除。由主题目录同步过来的目录显示为L1~L5图标，数据标准自有的目录显示原来的图标。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

算法来提高性能。） spark.sql.adaptive.skewedJoin.enabled（启用AQE用于倾斜的连接操作，可以通过自动检测倾斜的数据并相应地优化连接算法来提高性能） spark.sql.mergeSmallFiles.enabled（启用合并小文件功能，可以通

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
开发Pipeline作业 - 数据治理中心 DataArts Studio

开发Pipeline作业对已新建的作业进行开发和配置。开发Pipeline模式的批处理作业和实时处理作业，请您参考编排作业节点、配置作业基本信息、配置作业参数和调测并保存作业章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
源端为对象存储 - 数据治理中心 DataArts Studio

源端为对象存储 JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数表1 FTP/SFTP作为源端时的作业参数参数类型参数名说明取值样例基本参数源目录或文件要传输的目录或单个文件路径。 FROM_DIRECTORY/ or FROM_DIRECTORY/example.csv 文件格式传输数据时使用的格式。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
源端为FTP/SFTP - 数据治理中心 DataArts Studio

源端为FTP/SFTP JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
通过云专线连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过云专线打通网络的方案。图1 网络示意图

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
通过VPN连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过VPN打通网络的方案。图1 网络示意图

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
通过云专线连通网络 - 数据治理中心 DataArts Studio

通过云专线连通网络本章节主要为您介绍数据库部署在其他云厂商场景下，通过云专线打通网络的方案。图1 网络示意图约束限制资源组为私网网段，不能与数据源网段重叠，否则会导致网络无法打通。资源组不具有公网网段，因此本方案仅能与数据源的私网连通。前提条件已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
通过VPN连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络本章节主要为您介绍数据库部署在其他云厂商场景下的网络打通方案。图1 网络示意图约束限制资源组为私网网段，不能与数据源网段重叠，否则会导致网络无法打通。资源组不具有公网网段，因此本方案仅能与数据源的私网连通。前提条件已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

新建表/文件迁移作业操作场景 CDM可以实现在同构、异构数据源之间进行表或文件级别的数据迁移，支持表/文件迁移的数据源请参见支持的数据源。约束限制记录脏数据功能依赖于OBS服务。作业导入时，JSON文件大小不超过1MB。单文件传输大小不超过1TB。配置源端和目的端参数时，字段名不可包含&和%。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
源端为HDFS - 数据治理中心 DataArts Studio

源端为HDFS JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
跨Region通过云连接连通网络 - 数据治理中心 DataArts Studio

跨Region通过云连接连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组不同Reg

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
通过公网连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络本章节主要为您介绍数据库部署在其他云场景下，通过公网打通网络的方案。图1 网络示意图约束限制资源组不具有公网网段，只能通过公网NAT转换成固定的弹性公网IP访问公网，且该IP不能与数据源公网IP重复。前提条件已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在其他云
同Region不同租户通过对等连接连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过对等连接连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过企业路由器连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
通过公网连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在本地IDC场景下，通过公网打通网络的方案。图1 网络示意图约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
关系建模 - 数据治理中心 DataArts Studio

关系建模物理模型是指按照一定规则和方法，将逻辑模型中所定义的实体、属性、属性约束、关系等要素转换为数据库软件所能够识别的表关系图(Table Relationship Diagram)的一种物理描述。在关系建模中，您可以新建SDI层和DWI层两个模型，模型最终是通过物理建模进

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计

总条数： 84

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据标准 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发Pipeline作业 - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

配置FTP/SFTP源端参数 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

通过云专线连通网络 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

跨Region通过云连接连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过对等连接连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

通过公网连通网络 - 数据治理中心 DataArts Studio

关系建模 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线