搜索_华为云

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

多并发抽取/写入速率，定义为分别取作业抽取并发数为1、10、20、30、50时，最大的抽取/写入速率。数据源抽取写入性能实测数据常见数据源的性能实测结果分别如表1和表2所示。表1 读取性能实测数据数据源数据源规格版本单并发抽取速率（行/s）多并发抽取速率（行/s）云数据库 MySQL 8U 32G

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

说明默认值执行内存作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置CDM作业定时任务 - 数据治理中心 DataArts Studio

结束时间：该参数是可选参数，表示停止自动执行的时间。如果不配置，则表示一直自动执行。图2 重复周期为小时例如上图表示：定时配置从2023年1月1日0时0分生效，0:10时开始第一次自动执行作业，0:30第二次，0:50第三次，以后每2小时重复三次，2023年12月31日23时59分之后不再自动执行。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
如何选择版本 - 数据治理中心 DataArts Studio

规格名称：cdm.medium vCPUs/内存：4核 8GB 集群数量：1个规格名称：cdm.medium vCPUs/内存：4核 8GB 集群数量：1个规格名称：cdm.medium vCPUs/内存：4核 8GB 作业节点调度次数/天[2] 500次/天 5,000次/天 5,000次/天

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
OBS连接参数说明 - 数据治理中心 DataArts Studio

ttp是80。 443 OBS桶类型用户下拉选择即可，一般选择为“对象存储”。对象存储访问标识(AK) AK和SK分别为登录OBS服务器的访问标识与密钥。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。您可以通过如下方式获取访问密钥。登录控制台，在用户名下拉列表中选择“我的凭证”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置资源权限 - 数据治理中心 DataArts Studio

单击待创建权限策略HDFS组件下“hacluster”的“配置” ，进入配置界面单击“创建”，新建权限策略。图2 新建权限策略在弹出的策略配置页配置相关参数，配置完成单击“确定”，策略配置完成。图3 配置权限策略表2 配置HDFS权限策略参数说明参数名参数描述策略类型根据用户所选服务组件自动

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > Ranger权限访问控制
配置离线处理集成作业 - 数据治理中心 DataArts Studio

策略等原因，实际运行过程中的并发线程数可能小于此值。其中，集群最大并发数的设置与CDM集群规格有关，并发数上限建议配置为vCPU核数*2。例如8核16GB规格集群的最大抽取并发数上限为16。 3 分片重试次数每个分片执行失败时的重试次数，为0表示不重试。说明：目前仅对目

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
上传存量数据 - 数据治理中心 DataArts Studio

选择连接器类型连接H公司本地的Apache Hadoop HDFS文件系统时，连接类型选择“Apache HDFS”，然后单击“下一步”。图2 创建HDFS连接名称：用户自定义连接名称，例如“hdfs_link”。 URI：配置为H公司HDFS文件系统的Namenode URI地址。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
创建数据集成作业 - 数据治理中心 DataArts Studio

移到MySQL数据库中。图12 vertex_user_obs2rds作业运行成功参考2到4，完成vertex_movie_obs2rds、edge_friends_obs2rds和edge_rate_obs2rds作业的创建，将4张原始表从OBS迁移到MySQL中。新建MySQL到OBS迁移作业

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
性能调优 - 数据治理中心 DataArts Studio

并发数上限建议配置为vCPU核数*2，如表1所示。表1 集群最大抽取并发数配置建议规格名称 vCPUs/内存集群并发数上限参考 cdm.large 8核 16GB 16 cdm.xlarge 16核 32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
上传CDM连接驱动 - 数据治理中心 DataArts Studio

jar格式驱动。前提条件已创建集群。已参见表1下载对应的驱动。已参见FTP/SFTP连接参数说明创建SFTP连接并将对应的驱动上传至线下文件服务器（可选）。如何获取驱动不同类型的关系数据库，需要适配不同类型的驱动。注意，上传的驱动版本不必与待连接的数据库版本相匹配，直接参考表1获取建议版本的JDK8

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
开发Shell脚本 - 数据治理中心 DataArts Studio

见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

连接器类型选择“MRS Hive”后单击“下一步”配置Hive连接参数，如图6所示。图6 创建MRS Hive连接各参数说明如表2所示，需要您根据实际情况配置。表2 MRS Hive连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MRS Hive数据连接参数说明 - 数据治理中心 DataArts Studio

RS云服务才能连接。说明：当前DataArts Studio不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1,aes128-sha1”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

究、国际贸易促进等方面。在这之前，H公司采用其自建的大数据集群，并安排专人维护，每年固定购买电信联通双线专用带宽，在机房、电力、专网、服务器、运维方面进行高额投入，但其在面对客户不断变化的业务诉求时，因为人员投入不足，大数据集群能力不匹配，而无法聚焦业务创新，使得存量100T的数据只有4%的利用率。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 sql_link 数据库服务器配置为要连接的数据库的IP地址或域名。单击输入框后的“选择”，可获取用户的实例列表。 192.168.0.1 端口配置为要连接的数据库的端口。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
开发Python脚本 - 数据治理中心 DataArts Studio

选择Python版本。 Python2：Python版本为Python2 Python3：Python版本为Python3 主机连接选择执行Python脚本的主机。单击右侧的“输入参数”，可以输入执行Python脚本的参数和交互式参数。表2 Python脚本参数参数说明参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

2.1.X 1.3.X MRS Hive、MRS Hudi暂不支持2.x版本，建议使用的版本： 1.2.X 3.1.X 当前暂不支持对接“Kerberos加密类型”为“aes256-sha2,aes128-sha2”的MRS集群。如需对接MRS集群，请注意“Kerberos加密类型”应为“aes256-sha1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

说明默认值执行内存作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程

总条数： 787

上一页
1
...
7
8
9
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

MySQL同步到Kafka作业配置 - 数据治理中心 DataArts Studio

配置CDM作业定时任务 - 数据治理中心 DataArts Studio

如何选择版本 - 数据治理中心 DataArts Studio

OBS连接参数说明 - 数据治理中心 DataArts Studio

配置资源权限 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

上传存量数据 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

创建数据集成作业 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

上传CDM连接驱动 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

MRS Hive数据连接参数说明 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线