搜索_华为云

支持的数据源 - 数据治理中心 DataArts Studio

支持单表同步的数据源如表1 离线作业不同数据源读写能力说明所示：表1 离线作业不同数据源读写能力说明数据源分类数据源单表读单表写数据仓库 DWS、DLI 支持支持 Hadoop MRS Hive、MRS Hudi、Doris、ClickHouse、MRS HBase 支持

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
新增字段操作指导 - 数据治理中心 DataArts Studio

DM会将字段值直接写入目的端。如果字段映射关系不正确，您可以通过拖拽字段、单击对字段批量映射两种方式来调整字段映射关系。如果是导入到数据仓库服务（DWS），则还需在目的字段中选择分布列，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。多个数据段联合做主键的场景，建议设置所有主键作为分布列。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
示例场景说明 - 数据治理中心 DataArts Studio

示例场景说明本实践通过DataArts Studio服务的数据开发DLF组件和数据湖探索服务（DLI）对某电商商城的用户、商品、评论数据（脱敏后）进行分析，输出用户和商品的各种数据特征，可为营销决策、广告推荐、信用评级、品牌监控、用户行为预测提供高质量的信息。在此期间，您可以学

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
新建数据对账作业 - 数据治理中心 DataArts Studio

新建数据对账作业数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。数据质量监控中的对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。创建作业在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
新建规则 - 数据治理中心 DataArts Studio

新建规则管理所有业务规则，规则定义了指标间或者指标和数值间的关系，使用目录维护业务规则。前提条件已在DataArts Studio控制台的“实例 > 进入控制台 > 空间管理 > 数据质量 > 业务指标监控 > 规则管理”页面创建归属目录。基于指标创建业务规则，需要选择规则归属目录，请参见图1创建归属目录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

"_timestamp >= '${startTime}' and _timestamp < '${currentTime}'" } 源端数据库是数据仓库服务DWS或者MySQL时，对于时间的判断可以写成以下两种： _timestamp >= '2018-10-10 00:00:00' and

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

在CDM集群管理界面，单击集群后的“作业管理”，选择“连接管理 > 新建连接”，进入连接器类型的选择界面，如图3所示。图3 选择连接器类型连接器类型选择“数据仓库服务（DWS）”后单击“下一步”配置DWS连接参数，必填参数如表2所示，可选参数保持默认即可。表2 DWS连接参数参数名说明取值样例

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
CloudTable连接 - 数据治理中心 DataArts Studio

MRS：表示连接MRS。 FusionInsight HD：表示连接FusionInsight HD。 Apache Hadoop：表示连接开源Apache Hadoop。 linkConfig.zookeeperQuorum 是 String 连接“CloudTable”时必选，

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开关；开源MySQL数据库支持useCursorFetch参数，无需对此参数进行设置。 sslmode=require 引用符号可选参数，连接引用

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
同步IAM用户到数据源 - 数据治理中心 DataArts Studio

因此用户同步任务为DataArts Studio实例级别配置，各工作空间之间数据互通。前提条件新建用户同步任务前，已在管理中心创建数据仓库服务（DWS）或MapReduce服务（MRS Ranger）类型的数据连接，请参考创建DataArts Studio数据连接。新建用

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理
CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？华为云上涉及数据迁移的服务有以下几种：云数据迁移服务 CDM 对象存储迁移服务 OMS 数据复制服务 DRS 主机迁移服务 SMS 数据库和应用迁移 UGO 数据快递服务 DES 上述数据迁移服务的区别请参见各个数据迁移服务区别。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
新建离线处理集成作业 - 数据治理中心 DataArts Studio

算资源和存储资源方面经过优化，以确保高效的数据处理和分析。这些任务通常是定时（例如每天、每周）执行，主要处理大量历史数据，用于批量分析和数据仓库。实时处理：对源源不断产生的新数据进行实时处理和分析，以满足业务对数据的即时性需求。这种处理方式要求数据在产生后能够立即被处理，并给出相应的结果或触发相应的操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
作业的计划时间和开始时间相差大，是什么原因？ - 数据治理中心 DataArts Studio

作业的计划时间和开始时间相差大，是什么原因？问题描述如图所示，在作业实例监控页面查看作业运行记录时，发现作业的计划时间和开始时间相差较大。其中计划时间是作业预期开始执行的时间，即用户为作业配置的调度计划。开始时间是作业实际开始执行的时间。图1 问题示例图可能原因这是因为

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
HBase连接 - 数据治理中心 DataArts Studio

MRS：表示连接MRS的HBase。 FusionInsight HD：表示连接FusionInsight HD的HBase。 Apache Hadoop：表示连接开源Apache Hadoop的HBase。 linkConfig.uri 否 String 连接Apache Hadoop时的Namenode

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
开发SQL脚本 - 数据治理中心 DataArts Studio

开发SQL脚本数据开发支持对SQL脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。数据开发模块支持如下类型SQL脚本。而不同数据源的SQL语法有所差异，开发SQL语句前请预先了解各数据源的语法规则。 DLI SQL脚本：请参见SQL语法参考。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
配置行级访问控制 - 数据治理中心 DataArts Studio

值得注意的是，行级访问控制策略为DataArts Studio实例级别配置，各工作空间之间数据互通，全局可见并生效。前提条件新建DWS行级访问控制策略前，已在管理中心创建数据仓库服务（DWS）类型的数据连接，请参考创建DataArts Studio数据连接。DWS数据连接中的账户要具备待控制表的GRANT权限（数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
配置入口API算子 - 数据治理中心 DataArts Studio

配置调用API工作流需要输入的参数。入参定义主要由参数位置、参数类型、是否必填、允许空值以及默认值等组成。参数位置主要包括Query、Header、Path、Body四大类，另外还支持Static静态参数。 Query是位于URL后的查询参数内容，以“?”开始，通过“&”连接多个参数。 Header参数是位

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

型数据库通信使用二进制协议开关，即useCursorFetch=true。部分第三方可能存在兼容问题导致迁移时间转换出错，可以关闭此开关；开源MySQL数据库支持useCursorFetch参数，无需对此参数进行设置。数据源认证及其他功能配置认证类型是访问集群的认证类型：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
管理动态脱敏策略 - 数据治理中心 DataArts Studio

已完成用户同步，将IAM上的用户信息同步到数据源上，详见同步IAM用户到数据源。新建DWS脱敏策略前，已完成如下操作：已在管理中心创建数据仓库服务（DWS）类型的数据连接，请参考创建DataArts Studio数据连接。已完成用户同步，将IAM上的用户信息同步到数据源上，详见同步IAM用户到数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 动态脱敏任务
新建数据质量作业 - 数据治理中心 DataArts Studio

新建数据质量作业质量作业可将创建的规则应用到建好的表中进行质量监控。配置流程在DataArts Studio控制台首页，选择对应工作空间的“数据质量”模块，进入数据质量页面。（可选）选择“数据质量监控 > 质量作业”，新建目录。如果已存在可用的目录，可以不用新建目录。注意

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控

总条数： 190

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

支持的数据源 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

新建规则 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

CloudTable连接 - 数据治理中心 DataArts Studio

SAP HANA连接参数说明 - 数据治理中心 DataArts Studio

同步IAM用户到数据源 - 数据治理中心 DataArts Studio

CDM与其他数据迁移服务有什么区别，如何选择？ - 数据治理中心 DataArts Studio

新建离线处理集成作业 - 数据治理中心 DataArts Studio

作业的计划时间和开始时间相差大，是什么原因？ - 数据治理中心 DataArts Studio

HBase连接 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

配置行级访问控制 - 数据治理中心 DataArts Studio

配置入口API算子 - 数据治理中心 DataArts Studio

Apache HDFS数据连接参数说明 - 数据治理中心 DataArts Studio

管理动态脱敏策略 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线