搜索_华为云

Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

者是已经建立好了企业内部数据中心到华为云的VPN通道或专线。创建CDM集群并绑定EIP 如果是独立CDM服务，参考创建集群创建CDM集群；如果是作为DataArts Studio服务CDM组件使用，参考创建集群创建CDM集群。关键配置如下： CDM集群的规格，按待迁移的数据量选择，一般选择cdm

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
新建一个对账作业实例 - 数据治理中心 DataArts Studio

账作业”。单击“新建”，配置对账作业的基本信息，如下图所示。图1 配置基本信息单击“下一步”，进入规则配置页面。您需要单击规则卡片中的，然后配置对账规则，如下图所示。需要分别配置源端和目的端的信息。配置源端连接请参见DWS数据连接参数说明，配置目的端连接请参见DLI数据连接参数说明。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

通过StringUtil提取输出结果值配置简单，但对适用场景有如下要求：前一SQL节点的输出结果只有一个字段，形如[["11"]]所示。输出结果值数据类型为String，需要应用场景支持String数据类型。例如当需要使用IF条件判断输出结果值的数值大小时，不支持String类型，则不能使用本方法。通过For

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

然后进入作业开发页面，拖动DLI Spark节点到画布并单击，配置节点的属性。图3 配置节点属性关键属性说明： DLI队列：DLI中创建的DLI队列。作业运行资源：DLI Spark节点运行时，限制最大可以使用的CPU、内存资源。作业主类：DLI Spark节点的主类，本例的主类是“org

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MySQL数据迁移到OBS - 数据治理中心 DataArts Studio

用户的密码。 - 使用本地API 使用数据库本地API加速（系统会尝试启用MySQL数据库的local_infile系统变量）。是使用Agent Agent功能待下线，无需配置。 - local_infile字符集 MySQL通过local_infile导入数据时，可配置编码格式。 utf8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

用户的密码。 - 使用本地API 使用数据库本地API加速（系统会尝试启用MySQL数据库的local_infile系统变量）。是使用Agent Agent功能待下线，无需配置。 - local_infile字符集 MySQL通过local_infile导入数据时，可配置编码格式。 utf8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
配置数据血缘 - 数据治理中心 DataArts Studio

图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完成血缘的输出表配置后，单击确认，则此MRS Spark节点的血缘关系手动配置成功。后续当需要查看血缘关系

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

Spark_Python”。图2 新建作业进入到作业开发页面，拖动“MRS Spark Python”节点到画布中并单击，配置节点的属性。图3 配置MRS Spark Python节点属性参数设置说明： --master yarn --deploy-mode cluster

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
作业调度支持每月最后一天 - 数据治理中心 DataArts Studio

作业调度支持每月最后一天场景描述在配置作业调度时，可以选择每个月的最后一天执行。如果您需要配置作业的调度时间为每月最后一天，请参考下面两种方法。表1 配置每月最后一天进行调度配置方法优势如何配置调度周期配置为天，通过条件表达式进行判断是否为每月最后一天可以灵活适用

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

是否写入脏数据：如果需要将作业执行过程中处理失败的数据、或者被清洗过滤掉的数据写入OBS中，以便后面查看，可通过该参数配置，写入脏数据前需要在CDM先配置好OBS连接。这里保持默认值“否”即可，不记录脏数据。图7 任务配置单击“保存并运行”，回到作业管理界面，在作业管理界面可查看作业执行进度和结果。作业执

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

单击CDM作业名称后面的跳转到CDM作业配置界面。图5 编辑CDM作业在源端作业配置的高级属性里面，通过配置where子句获取迁移所需的数据，作业运行时，将从源端获取到的迁移数据复制导出并导入目的端。图6 配置where子句 where子句配置如下： dt > '${maxtime}' 父主题：使用教程

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

Studio服务CDM组件使用，参考创建集群创建CDM集群。关键配置如下： CDM集群的规格，按待迁移的数据量选择，一般选择cdm.medium即可，满足大部分迁移场景。 CDM集群的VPC必须和云搜索服务集群所在VPC一致，且推荐子网、安全组也与云搜索服务一致。如果安全控制原因不能使用相同子网

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

创建CDM集群并绑定EIP 如果是独立CDM服务，参考创建集群创建CDM集群；如果是作为DataArts Studio服务CDM组件使用，参考创建集群创建CDM集群。关键配置如下： CDM集群的规格，按待迁移的数据量选择，一般选择cdm.medium即可，满足大部分迁移场景。 CDM集群所在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

是否需要测试Hive JDBC连通。否是否使用集群配置您可以通过使用集群配置，简化Hadoop连接参数配置。否集群配置名仅当“是否使用集群配置”为“是”时，此参数有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hive_01 单击“保存”回到连接管理界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据目录典型场景教程 - 数据治理中心 DataArts Studio

数据目录典型场景教程配置增量元数据采集任务通过数据目录查看数据血缘关系父主题：数据目录

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录
作业任务参数调优 - 数据治理中心 DataArts Studio

说明：该配置会占用总体资源，影响新增其他作业，非必要不配置。 taskmanager.memory.process.size int 3686MB taskmanager的处理内存，直接影响堆内存大小。说明：该配置会占用总体资源，影响新增其他作业，非必要不配置。 taskmanager

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
管理中心典型场景教程 - 数据治理中心 DataArts Studio

管理中心典型场景教程新建DataArts Studio与MRS Hive数据湖的连接新建DataArts Studio与DWS数据湖的连接新建DataArts Studio与MySQL数据库的连接父主题：管理中心

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
配置增量元数据采集任务 - 数据治理中心 DataArts Studio

配置增量元数据采集任务配置、运行采集任务是构建数据资产的前提，下面举例说明如何通过配置采集任务达到灵活采集元数据的目的。场景一：仅添加新元数据用户的数据库中新增的数据表，采集任务仅采集新增的表。例如新增table4的情况下：采集前的数据表元数据：table1，table2，table3

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程
获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

的API，图2为API返回值的JSON消息体。使用场景：需要获取集群列表中第一个集群的cluster Id，然后作为参数传递给后面的节点使用。关键配置：在第一个Rest Client的“响应消息体解析为传递参数定义”配置中，配置clusterId=clusters[0].clusterId，后续的Rest

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
使用前必读 - 数据治理中心 DataArts Studio

使用前必读概述调用说明基本概念终端节点Endpoint 项目ID和账号ID 实例ID和工作空间ID 数据资产guid 约束与限制

 帮助中心 > 数据治理中心 DataArts Studio > API参考

总条数： 1471

上一页
1
2
3
4
5
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Elasticsearch整库迁移到云搜索服务 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

获取SQL节点的输出结果值 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

MySQL数据迁移到OBS - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

作业调度支持每月最后一天 - 数据治理中心 DataArts Studio

OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

查询SQL获取max值传递给CDM作业 - 数据治理中心 DataArts Studio

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

数据目录典型场景教程 - 数据治理中心 DataArts Studio

作业任务参数调优 - 数据治理中心 DataArts Studio

管理中心典型场景教程 - 数据治理中心 DataArts Studio

配置增量元数据采集任务 - 数据治理中心 DataArts Studio

获取Rest Client节点返回值教程 - 数据治理中心 DataArts Studio

使用前必读 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线