搜索_华为云

步骤1：流程设计 - 数据治理中心 DataArts Studio

各组织部门之间对数据、资源的访问控制本示例不涉及涉及到用户的权限和资源权限控制 2 数据集成有哪些数据源要迁移，数据源版本 CSV格式的数据，存储于OBS桶 - 每种数据源的数据全量数据规模 2，114 字节 - 每种数据源每天的增量数据规模本示例不涉及 - 迁移目的端数据源种类以及版本

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
自动建表映射规则 - 数据治理中心 DataArts Studio

配置字段映射时，数据源支持的数据类型请参见表1，以确保数据完整导入到目的端。表1 支持的数据类型数据连接类型数据类型说明 MySQL 请参见MySQL数据库作为源端时目的端自动建表支持的数据类型。 MySQL数据库作为源端时目的端自动建表支持的数据类型源端为MySQL数据库，目的端为Hudi时，支持自动建表的数据类型如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 实时处理集成作业开发
Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

Oracle数据库连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 oracle_link 数据库服务器配置为要连接的数据库的IP地址或域名。 192.168.0.1 端口配置为要连接的数据库的端口。默认端口：1521 数据库连接类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 sql_link 数据库服务器配置为要连接的数据库的IP地址或域名。单击输入框后的“选择”，可获取用户的实例列表。 192.168.0.1 端口配置为要连接的数据库的端口。不同的数据库端口不同，请根据具体情况配置。例如：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

新建作业”，开始创建从OBS导出数据到云搜索服务的任务。图6 创建OBS到云搜索服务的迁移任务作业名称：用户自定义便于记忆、区分的任务名称。源端作业配置源连接名称：选择创建OBS连接中的“obslink”。桶名：待迁移数据的桶。源目录或文件：待迁移数据的路径，也可以迁移桶下的所有目录、文件。文

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
配置DWS目的端参数 - 数据治理中心 DataArts Studio

过数据库的事务模式将数据迁移到目标表中，导入失败则将目的表回滚到作业开始之前的状态。默认为“否”，CDM直接将数据导入到目的表。这种情况下如果作业执行失败，已经导入到目标表中的数据不会自动回滚。说明：如果“导入开始前”选择“清除部分数据”或“清除全部数据”，CDM的事务模式不会回滚已经删除的数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数作业中目的连接为HBase连接或CloudTable连接时，即导入数据到以下数据源时，目的端作业参数如表1所示。表1 HBase/CloudTable作为目的端时的作业参数参数名说明取值样例表名写入数据的HBase表名。如果是创建

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
自动建表原理介绍 - 数据治理中心 DataArts Studio

自动建表原理介绍 CDM将根据源端的字段类型进行默认规则转换成目的端字段类型，并在目的端建数据表。自动建表时的字段类型映射 CDM在数据仓库服务（Data Warehouse Service，简称DWS）中自动建表时，DWS的表与源表的字段类型映射关系如图1所示。例如使用CDM

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
ETL Job - 数据治理中心 DataArts Studio

单击配置需要转换的源端数据和目的端数据。当前支持的源端数据为DLI类型、OBS类型和MySQL类型。当源端数据为DLI类型时，支持的目的端数据类型为CloudTable（仅华北-北京一支持）、DWS、GES、CSS、OBS、DLI。当源端数据为MySQL类型时，支持的目的端数据类型为MySQL。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

已新建连接，详情请参见创建CDM与数据源之间的连接。 CDM集群与待迁移数据源可以正常通信。操作步骤进入CDM主界面，单击左侧导航上的“集群管理”，选择集群后的“作业管理”。选择“表/文件迁移 > 新建作业”，进入作业配置界面。图1 新建表/文件迁移的作业选择源连接、目的连接：作业名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
步骤6：数据开发处理 - 数据治理中心 DataArts Studio

作业开发历史数据到源数据表，使用数据集成将历史数据从OBS导入到SDI贴源层的原始数据表。历史数据清洗，使用数据开发的MRS Hive SQL脚本将源数据表清洗之后导入DWI层的标准出行数据表。将基础数据插入维度表中。将DWI层的标准出行数据导入DWR层的事实表中。数据汇总，通过Hive

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
配置离线处理集成作业 - 数据治理中心 DataArts Studio

避免抽取速度过大，给源库造成太大的压力。限速最小配置为1MB/S。不限速：在不限速的情况下，任务将在所配置的并发数的限制基础上，提供现有硬件环境下最大的传输性能。说明：支持对MRS Hive\DLI\关系数据库\OBS\Apache HDFS作为目的端的作业进行单并发限速。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
目的端为关系数据库 - 数据治理中心 DataArts Studio

标表的字符类型字段长度设置为源表相应字段长度的3倍。 toJobConfig.useNullable 否 Boolean 当选择自动创建目的表时，如果选择使用非空约束，则目的表字段的是否非空约束，与原表具有相应非空约束的字段保持一致。父主题：目的端作业参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
目的端为Hive - 数据治理中心 DataArts Studio

写入表数据时，用户选择的操作： DO_NOTHING：不自动建表。 CREATE_WHEN_NOT_EXIST：当目的端的数据库没有“tableName”参数中指定的表时，CDM会自动创建该表。 DROP_AND_CREATE：先删除“tableName”参数中指定的表，然后再重新创建该表。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

基础与网络连通配置 IP或域名是关系型数据库数据源的访问地址，可填写为IP或域名。 “IP或域名”如果手动填写，必须写内网IP，端口必须为对资源组网段放开的端口（如需设置请参见设置安全组规则），否则可能导致网络连接不通。如果为RDS或GaussDB等云上数据源，可以通过管理控制台获取访问地址：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
查询目的表和字段(待下线) - 数据治理中心 DataArts Studio

} else { fmt.Println(err) } } 更多编程语言的SDK代码示例，请参见API Explorer的代码示例页签，可生成自动对应的SDK代码示例。状态码状态码描述 200 Success 400 BadRequest 401

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 关系建模接口
时间宏变量使用解析 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持通过宏定义变量表示符“${}”来完成时间类型的宏定义，当

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
配置MySQL/SQL Server/PostgreSQL目的端参数 - 数据治理中心 DataArts Studio

据”，CDM的事务模式不会回滚已经删除的数据。否扩大字符字段长度选择自动创表时，迁移过程中可将字符类型的字段长度扩大为原来的3倍，再写入到目的表中。如果源端数据库与目的端数据库字符编码不一样，但目的表字符类型字段与源表一样，在迁移数据时，可能会有出现长度不足的错误。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业目的端参数
目的 - 数据治理中心 DataArts Studio

目的数据是企业核心资产，企业需要建立起数据字典，有效管理其日益重要的数据和信息资源；同时建立数据持续改进机制，来不断提升数据质量。数据的价值和风险应被有效管理，以支撑企业管理简化、业务流集成、运营效率提升和经营结果的真实呈现。数据准确是科学决策的基础，数据架构和标准的统一是全流程高效运作、语言一致的前提。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

Studio基于数据湖底座，提供一站式数据开发、治理和服务等能力。数据集成的数据连接仅限于在数据集成中使用，用于将源端原始数据集成到目的端数据湖底座中，数据集成支持的数据源请参见数据集成支持的数据源。表1 DataArts Studio支持的数据源数据源类型管理中心数据架构数据开发数据目录[2] 数据质量[3]

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心

总条数： 860

上一页
1
2
3
4
5
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

步骤1：流程设计 - 数据治理中心 DataArts Studio

自动建表映射规则 - 数据治理中心 DataArts Studio

Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

配置DWS目的端参数 - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

自动建表原理介绍 - 数据治理中心 DataArts Studio

ETL Job - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

步骤6：数据开发处理 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

目的端为关系数据库 - 数据治理中心 DataArts Studio

目的端为Hive - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

查询目的表和字段(待下线) - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

配置MySQL/SQL Server/PostgreSQL目的端参数 - 数据治理中心 DataArts Studio

目的 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线