搜索_华为云

概览 - 数据治理中心 DataArts Studio

指导您快速实现数据库迁移和同步。表1 Migration基础实践一览表数据源分类源端数据源对应目的端数据源相关文档关系型数据 MySQL Hadoop：MRS Hudi MySQL同步到MRS Hudi作业配置消息系统：DMS Kafka MySQL同步到DMS Kafka作业配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
关系数据库连接 - 数据治理中心 DataArts Studio

linkConfig.usingNative 否 Boolean 是否使用数据库本地API加速。创建MySQL连接时，使用本地API加速，可以使用MySQL的LOAD DATA功能加快数据导入，提高导入数据到MySQL数据库的性能。说明： REPLACE 和 IGNORE 修饰符用于

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
支持的数据类型 - 数据治理中心 DataArts Studio

配置字段映射时，数据源支持的数据类型请参见表1，以确保数据完整导入到目的端。表1 支持的数据类型数据连接类型数据类型说明 MySQL 请参见MySQL数据库迁移时支持的数据类型。 SQL Server 请参见SQL Server数据库迁移时支持的数据类型。 Oracle 请参见Oracle数据库迁移时支持的数据类型。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
使用教程 - 数据治理中心 DataArts Studio

使用教程新建一个业务场景新建一个质量作业新建一个对账作业实例父主题：数据质量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量
补数据场景使用介绍 - 数据治理中心 DataArts Studio

只有数据开发作业配置了周期调度，才支持使用补数据功能。使用案例案例场景在某企业的产品数据表中，有一个记录产品销售额的源数据表A，现在需要把产品销售额的历史数据导入的目的表B里面，需要您配置补数据作业的相关操作。需要导入的列表情况如表1所示。表1 需要导入的列表情况源数据表名目的表名 A B 配置方法

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
数据目录支持采集哪些对象的资产？ - 数据治理中心 DataArts Studio

据：关系型数据库，如MySQL/PostgreSQL等（可使用RDS类型连接，采集其元数据）云搜索服务CSS 图引擎服务GES 对象存储服务OBS MRS Hudi组件（MRS Hudi作为一种数据格式，元数据存放在Hive中，操作通过Spark进行。在Hudi表开启“同步hive表配置”后，可通过采集MRS

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
使用教程 - 数据治理中心 DataArts Studio

使用教程数据架构示例父主题：数据架构

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

Studio支持连接哪些数据源？ DataArts Studio支持对接如DLI、DWS、MRS Hive等云服务，也支持对接如MySQL、Oracle等传统数据库，支持程度各有不同，详情请参见DataArts Studio支持的数据源章节。 DataArts Studio对接数据源，

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL 第一步：在执行任务的服务器上安装相应的包 pip install krbcontext（版本0.10） pip install kerberos（版本1.3.1） pip install impala 命令样例如下：

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

数据开发模块作为一站式大数据开发平台，支持多种大数据工具的开发。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能；可以将SQL语句转换为MapReduce任务进行运行。环境准备已开通MapReduce服务MRS，并创建MRS集群，为Hive

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置分库源端参数 - 数据治理中心 DataArts Studio

作业中源连接为分库连接，源端作业参数如表1所示。表1 分库作为源端时的作业参数参数类型参数名说明取值样例基本参数模式或表空间表示待抽取数据的模式或表空间名称。单击输入框后面的按钮可进入模式选择界面，分库连接时此处默认展示对应第一个后端连接的表空间。用户也可以直接输入模式或表空间名称。如

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
引用脚本模板和参数模板的使用介绍 - 数据治理中心 DataArts Studio

引用脚本模板和参数模板的使用介绍使用场景该功能适用于以下场景： Flink SQL脚本可以引用脚本模板。在pipeline作业开发中，MRS Flink Job节点可以使用引入了脚本模板的Flink SQL脚本，同时在MRS Flink Job节点的“运行程序参数”里面可以引用参数模板。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

绑定Agent：环境准备中创建的CDM集群。创建数据库在DWS中创建数据库，以“gaussdb”数据库为例。创建数据库的详情请参考新建数据库进行操作。创建数据表在“gaussdb”数据库中创建数据表trade_log和trade_report。详情请参考如下建表脚本。 create schema

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
补数据场景使用介绍 - 数据治理中心 DataArts Studio

只有数据开发作业配置了周期调度，才支持使用补数据功能。使用案例案例场景在某企业的产品数据表中，有一个记录产品销售额的源数据表A，现在需要把产品销售额的历史数据导入的目的表B里面，需要您配置补数据作业的相关操作。需要导入的列表情况如表1所示。表1 需要导入的列表情况源数据表名目的表名 A B 配置方法

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
For Each节点使用介绍 - 数据治理中心 DataArts Studio

getNodeOutput('preNodeName')}：获取前面节点的输出。使用案例案例场景因数据规整要求，需要周期性地将多组DLI源数据表数据导入到对应的DLI目的表，如表1所示。表1 需要导入的列表情况源数据表名目的表名 a_new a b_2 b c_3 c d_1 d c_5

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

c名称。此处不能使用EL表达式#{Job.getParam("job_param_name")} ，因为此表达式只能直接获取当前作业里配置的参数的value，并不能获取到父作业传递过来的参数值，也不能获取到工作空间里面配置的全局变量，作用域仅为本作业。而表达式${job_pa

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

如何降低CDM使用成本？如果是迁移公网的数据上云，可以使用NAT网关服务，实现CDM服务与子网中的其他弹性云服务器共享弹性IP，可以更经济、更方便的通过Internet迁移本地数据中心或第三方云上的数据。具体操作如下：假设已经创建好了CDM集群（无需为CDM集群绑定专用弹性

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
实时报警平台搭建 - 数据治理中心 DataArts Studio

为定期执行该脚本（使用DLF作业开发和作业调度每天定时输出告警统计报表），实现定期输出告警统计报表。创建CDM作业方案的最后一步需要将OBS中的告警统计报表迁移到RDS MySQL中，我们选择使用CDM来实现该功能。关键参数说明：作业名称：obs_rds，在后续的作业中设

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
约束与限制 - 数据治理中心 DataArts Studio

户才能通过认证鉴权，从而使用API、SDK等方式访问DataArts Studio。各组件API的流量限制请参见API概览。数据集成API的约束如下： CDM的作业数据量太多，会造成数据库压力，建议定时清理不需要的作业。短时间内下发大量作业，可能会导致集群资源耗尽异常等，您调用API时需要注意。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍该章节介绍如何在脚本及作业中引用参数，以及引用后的生效范围、是否支持EL表达式和简易变量集等，让您更加清晰地了解工作空间级和脚本、作业级配置参数的使用方法。工作空间环境变量参数、作业参数、脚本参数均可以配置参数，但作用范围不同；另外如果工作空间环境

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程

总条数： 1422

上一页
1
2
3
4
5
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

概览 - 数据治理中心 DataArts Studio

关系数据库连接 - 数据治理中心 DataArts Studio

支持的数据类型 - 数据治理中心 DataArts Studio

使用教程 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

数据目录支持采集哪些对象的资产？ - 数据治理中心 DataArts Studio

使用教程 - 数据治理中心 DataArts Studio

DataArts Studio支持连接哪些数据源？ - 数据治理中心 DataArts Studio

使用Python脚本连接MRS安全集群执行Impala SQL - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

配置分库源端参数 - 数据治理中心 DataArts Studio

引用脚本模板和参数模板的使用介绍 - 数据治理中心 DataArts Studio

开发一个DWS SQL作业 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

For Each节点使用介绍 - 数据治理中心 DataArts Studio

获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

如何降低CDM使用成本？ - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线