搜索_华为云

配置OBS源端参数 - 数据治理中心 DataArts Studio

.md5 迁移文件或对象时支持文件级增量迁移（通过配置跳过重复文件实现），但不支持断点续传。例如要迁移3个文件，第2个文件迁移到一半时由于网络原因失败，再次启动迁移任务时，会跳过第1个文件，从第2个文件开始重新传，但不能从第2个文件失败的位置重新传。文件迁移时，单个任务支

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
CDM作业配置管理 - 数据治理中心 DataArts Studio

此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据集成应用示例 - 数据治理中心 DataArts Studio

直接使用已创建的集群ID。如果您需要使用新的集群执行迁移任务，调用创建集群API创建。创建连接调用创建连接API创建MySQL连接和DWS连接。创建迁移作业调用指定集群创建作业API创建MySQL到DWS的迁移作业。查看作业结果调用启动作业API开始执行作业。准备数据

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
配置CDM作业定时任务 - 数据治理中心 DataArts Studio

配置CDM作业定时任务在表/文件迁移的任务中，CDM支持定时执行作业，按重复周期分为：分钟、小时、天、周、月。 CDM在配置定时作业时，不要为大量任务设定相同的定时时间，应该错峰调度，避免出现异常。如果通过DataArts Studio数据开发调度CDM迁移作业，此处也配置了定时任务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
步骤3：数据集成 - 数据治理中心 DataArts Studio

满足业务需求，在购买DataArts Studio基础包实例后，您可以根据实际需求购买批量数据迁移增量包。购买数据迁移增量包的具体操作请参考购买批量数据迁移增量包章节。新建数据迁移的源连接、目的连接登录CDM管理控制台。单击左侧导航上的“集群管理”，进入集群管理界面。或参考访问DataArts

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
实时报警平台搭建 - 数据治理中心 DataArts Studio

创建CDM作业方案的最后一步需要将OBS中的告警统计报表迁移到RDS MySQL中，我们选择使用CDM来实现该功能。关键参数说明：作业名称：obs_rds，在后续的作业中设置为定期执行该作业（使用DLF作业开发和作业调度每天定时输出告警统计报表），实现定期迁移数据。源端：存

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
配置DLI目的端参数 - 数据治理中心 DataArts Studio

的端作业参数如表1所示。使用CDM服务迁移数据到DLI时，DLI要在OBS的dli-trans*内部临时桶生成数据文件，因此在需要赋予DLI连接中使用AK/SK所在用户对dli-trans*桶的读、写、创建目录对象等权限，否则会导致迁移失败。dli-trans*内部临时桶的权限

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
创建数据集成作业 - 数据治理中心 DataArts Studio

在“作业管理”页面，单击“表/文件迁移”，再单击“新建作业”。图21 表/文件迁移按照如下步骤将MySQL中的4张原始数据表，依次迁移到MRS Hive中。配置作业vertex_user_rds2hive。源端的“表名”选择在新建OBS到MySQL迁移作业中迁移到MySQL的vert

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
管理中心配置数据搬迁 - 数据治理中心 DataArts Studio

导出完成后可在资源迁移任务列表中，单击对应任务的“下载”按钮，本地获取导出的资源包。图5 下载导出结果新空间导入资源请您登录控制台首页，选择并进入新工作空间的“管理中心”模块，然后执行如下操作进行资源导入。在管理中心页面，单击“资源迁移”，进入资源迁移页面。图6 资源迁移单击“

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
主机连接参数说明 - 数据治理中心 DataArts Studio

压力。在调度Shell、Python脚本时，Agent会访问ECS主机，如果Shell、Python脚本的调度频率很高，ECS主机会将Agent的内网IP加入黑名单。为了保障作业的正常调度，强烈建议您使用ECS主机的root用户将绑定Agent（即CDM集群）的内网IP加到/etc/hosts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

large：8核CPU、16G内存的虚拟机，最大带宽/基准带宽为3/0.8 Gbps，集群作业并发数上限为16。 cdm.xlarge：16核CPU、32G内存的虚拟机，最大带宽/基准带宽为10/4 Gbps，集群作业并发数上限为32，适合使用10GE高速带宽进行TB级以上的数据量迁移。 cdm.4x

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
配置数据血缘 - 数据治理中心 DataArts Studio

DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
配置数据血缘 - 数据治理中心 DataArts Studio

DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
CDM支持的监控指标 - 数据治理中心 DataArts Studio

该指标为从物理机层面采集的磁盘使用率，数据准确性低于从弹性云服务器内部采集的数据。单位：%。 0.001%~90% CDM集群实例 1分钟 disk_io 磁盘io 该指标为从物理机层面采集的磁盘每秒读取和写入的字节数，数据准确性低于从弹性云服务器内部采集的数据。单位：Byte/sec 0~10GB

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群 > 管理并查看CDM监控指标
DIS连接 - 数据治理中心 DataArts Studio

DIS连接介绍通过DIS连接可以与DIS建立连接，并按照用户指定配置将DIS中的数据迁移到其他数据源。连接样例 { "links": [ { "link-config-values": { "configs":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

电信联通双线专用带宽，在机房、电力、专网、服务器、运维方面进行高额投入，但其在面对客户不断变化的业务诉求时，因为人员投入不足，大数据集群能力不匹配，而无法聚焦业务创新，使得存量100T的数据只有4%的利用率。在将本地的贸易统计数据迁移到华为云之后，基于华为公有云的大数据分析能力

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 css_link Elasticsearch服务器列表配置为一个或多个Elasticsearch服务器的IP地址或域名，包括端口号，格式为“ip:port”，多个地址之间使用“;”分隔。 192.168.0.1:9200;192

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
数据血缘方案简介 - 数据治理中心 DataArts Studio

3、wk_04和wk_05的表数据。图1 数据血缘关系示例 DataArts Studio数据血缘实现方案数据血缘的产生： DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
数据血缘方案简介 - 数据治理中心 DataArts Studio

3、wk_04和wk_05的表数据。图1 数据血缘关系示例 DataArts Studio数据血缘实现方案数据血缘的产生： DataArts Studio数据血缘解析方案包含自动分析血缘和手动配置血缘两种方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘

总条数： 860

上一页
1
...
5
6
7
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置OBS源端参数 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

数据集成应用示例 - 数据治理中心 DataArts Studio

配置CDM作业定时任务 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

配置DLI目的端参数 - 数据治理中心 DataArts Studio

创建数据集成作业 - 数据治理中心 DataArts Studio

管理中心配置数据搬迁 - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

CDM支持的监控指标 - 数据治理中心 DataArts Studio

DIS连接 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线