搜索_华为云

基线运维约束限制 - 数据治理中心 DataArts Studio

使用基线运维特性时，为了保证任务的优先级生效，需要注意以下要求： MRS约束限制：在MRS集群场景中，优先级配置只支持使用MRS API模式的数据连接类型，不支持代理模式的数据连接。 DataArts Studio的MRS节点支持优先级功能，如果MRS集群如果是安全模式（Kerberos认证为开启状态），需要增加MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
步骤3：数据集成 - 数据治理中心 DataArts Studio

是否需要测试Hive JDBC连通。否是否使用集群配置您可以通过使用集群配置，简化Hadoop连接参数配置。否集群配置名仅当“是否使用集群配置”为“是”时，此参数有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hive_01 新建表/文件迁移作业

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
CDM可以跨账户使用吗？ - 数据治理中心 DataArts Studio

在IAM控制台创建用户组，并授予CDM集群只读权限“CDM ReadOnlyAccess”。创建用户并加入用户组在IAM控制台创建用户，并将其加入1中创建的用户组。用户登录并验证权限新创建的用户登录控制台，切换至授权区域，验证权限：在“服务列表”中选择“云数据迁移服务”，进入CDM主界面查看集群，若未提示权限不足，表示“CDM

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

API创建、启动、查询、删除该CDM作业。需要提前准备以下数据：云账号的用户名、账号名和项目ID。创建一个CDM集群，并获取集群ID。获取方法：在集群管理界面，单击CDM集群名称可查看集群ID，例如“c110beff-0f11-4e75-8b10-da7cd882b0ef”。创建一个My

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

Studio服务CDM组件使用，参考创建集群创建CDM集群。该场景下，如果CDM集群只是用于迁移OBS数据到DLI，不需要迁移其他数据源，则CDM集群所在的VPC、子网、安全组选择任一个即可，没有要求，CDM通过内网访问DLI和OBS。主要是选择CDM集群的规格，按待迁移的数据量选择，一般选择cdm

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MRS中恢复HBase表 - 数据治理中心 DataArts Studio

需要使用快照保证数据不变，然后再迁移并恢复。约束限制本方案仅支持迁移数据到MRS 1.x版本集群，2.x及之后版本无法通过HBase修复命令重建HBase表。迁移的目标集群为2.x及之后版本时，HBase修复命令已经不再支持，通过HBase数据目录迁移的方式无法使用。使用命令恢复历史不变的数据

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
如何备份CDM作业？ - 数据治理中心 DataArts Studio

如何备份CDM作业？问题描述如何备份CDM作业？解决方案用户可以先通过CDM的批量导出功能，把所有作业脚本保存到本地，在需要的时候再重新创建集群、重新导入作业，实现作业备份。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置元数据采集任务 - 数据治理中心 DataArts Studio

schema、命名空间）、数据表进行修改。数据表 CSS 选择集群选择待采集数据存储的CSS集群。您也可以单击“新建”，创建CSS集群，创建完成后单击“刷新”，选择新建的CSS集群即可。绑定Agent 请选择由CDM集群提供的Agent。用户也可以单击“新建”，创建新的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
作业任务参数说明 - 数据治理中心 DataArts Studio

作业任务参数说明在指定集群创建作业或者随机集群创建作业并执行时，由“driver-config-values”参数指定作业任务配置，包含如下功能：作业失败重试：如果作业执行失败，可选择是否自动重新启动作业。作业分组：CDM支持对作业进行分组，分组后的作业可以按组显示、按组批

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

可以通过Spark作业进行分析处理。本章节通过一个例子演示如何在数据开发模块中提交一个Spark作业。操作流程如下：创建DLI集群，通过DLI集群的物理资源来运行Spark作业。获取Spark作业的演示JAR包，并在数据开发模块中关联到此JAR包。创建数据开发模块作业，通过DLI

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

择，该参数用于数据传到云搜索服务/Elasticsearch后，通过Elasticsearch的数据转换pipeline进行数据格式变换。 toJobConfig.createIndexStrategy 否枚举对于持续写入数据到Elasticsearch的流式作业，CDM支持

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

Clickhouse node 8U32G * 2 clickhouse 22.3.2.2 187265 / Elasticsearch 4U8G *6 elasticsearch7.10.2 28752 / RDS（Postgresql） 4U32G（主备模式） Postgresql

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

成作业包含CDM作业、离线作业和实时作业三种场景，支持的数据源情况如下：数据集成（CDM作业）的数据连接在CDM集群中创建，CDM集成作业支持的数据源与CDM集群版本相关，详情请参见数据集成（CDM作业）支持的数据源。数据集成（离线作业）的数据连接来自于管理中心中适用组件已勾

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数表1 Elasticsearch作为目的端时的作业参数参数类型参数名说明取值样例基本参数索引待写入数据的Elasticsearch的索引，类似关系数据库中的数据库名称。CDM支持自动创建索引和类型，索引和类型名称只能全部小写，不能有大写。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
CDM迁移性能如何？ - 数据治理中心 DataArts Studio

CDM迁移性能如何？单个cdm.large规格实例理论上可以支持1TB～8TB/天的数据迁移，实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

CDM集群。企业项目当关联了多个工作空间后，需要为CDM集群指定一个企业项目。集群名称自定义数据集成集群名称。实例类型目前数据集成集群支持以下部分规格供用户选择： cdm.large：8核CPU、16G内存的虚拟机，最大带宽/基准带宽为3/0.8 Gbps，集群作业并发数上限为16。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
数据集成概述 - 数据治理中心 DataArts Studio

Migration，后简称CDM）服务，本文中的“云数据迁移”、“CDM”均指“数据集成”。您可以通过以下方式之一进入CDM主界面：登录CDM控制台，单击“集群管理”，进入到CDM主界面。登录DataArts Studio控制台。选择对应工作空间的“数据集成”模块，进入CDM主界面。云数据迁移简介

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

是否需要测试Hive JDBC连通。否是否使用集群配置您可以通过使用集群配置，简化Hadoop连接参数配置。否集群配置名仅当“是否使用集群配置”为“是”时，此参数有效。此参数用于选择用户已经创建好的集群配置。集群配置的创建方法请参见管理集群配置。 hive_01 单击“保存”回到连接管理界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

Flink”节点到画布中并单击，配置节点的属性。图2 配置MRS Flink节点属性参数设置说明： --Flink作业名称 wordcount --MRS集群名称选择一个MRS集群 --运行程序参数 -c org.apache.flink.streaming.examples.wordcount.WordCount

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 数据治理中心 DataArts Studio

如果要创建MRS安全集群的数据连接，不能使用admin用户。因为admin用户是默认的管理页面用户，这个用户无法作为安全集群的认证用户来使用。您可以创建一个新的MRS用户，然后在创建MRS数据连接时，“用户名”和“密码”填写为新建的MRS用户及其密码。如果CDM集群为2.9.0版本及之后版本，且MRS集群为3

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）

总条数： 521

上一页
1
...
9
10
11
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基线运维约束限制 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

CDM可以跨账户使用吗？ - 数据治理中心 DataArts Studio

如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

MRS中恢复HBase表 - 数据治理中心 DataArts Studio

如何备份CDM作业？ - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

作业任务参数说明 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

CDM迁移性能如何？ - 数据治理中心 DataArts Studio

（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

新建MRS Hive连接时，提示：CORE_0031:Connect time out. (Cdm.0523) 怎么解决？ - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线