搜索_华为云

MD5校验文件一致性 - 数据治理中心 DataArts Studio

有MD5值的文件至目的端，没有MD5值或者MD5不匹配的数据文件将迁移失败，MD5文件自身不被迁移。若未配置“MD5文件名后缀”，则迁移所有文件。写入时该功能目前只支持目的端为OBS。可校验写入OBS的文件，是否与CDM抽取的文件一致。该功能由目的端作业参数“校验MD5值

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
迁移作业原理 - 数据治理中心 DataArts Studio

其所访问的公网带宽规格。通过VPN、NAT或专线互通时，网络带宽受到VPN、NAT或专线带宽的限制。目的端写入性能取决于目的端数据源的性能。如需优化，请参见目的端数据源的相关说明文档。父主题：优化迁移性能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
Kafka连接参数说明 - 数据治理中心 DataArts Studio

SIMPLE：非安全模式选择Simple鉴权。 KERBEROS：安全模式选择Kerberos鉴权。是单击“显示高级属性”，然后单击“添加”，您可以添加客户端的配置属性。所添加的每个属性需配置属性名称和值。对于不再需要的属性，可单击属性后的“删除”按钮进行删除。 Apache Kafka Apache

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
性能调优 - 数据治理中心 DataArts Studio

作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
指定文件名迁移 - 数据治理中心 DataArts Studio

指定文件名迁移从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
OBS连接参数说明 - 数据治理中心 DataArts Studio

OBS连接参数说明 OBS连接目的端OBS桶需添加读写权限，并在连接时不需要认证文件。 CDM集群和OBS桶不在同一个Region时，不支持跨Region访问OBS桶。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。连接OBS时，相关连接参数如表1所示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
CDM作业配置管理 - 数据治理中心 DataArts Studio

此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
通过VPN连通网络 - 数据治理中心 DataArts Studio

端口可满足Migration访问？进行安全组规则端口配置。（可选）本地IDC配置VPN对端网关设备。本地IDC网络采用不同类型的防火墙或主机，可参考《虚拟专用网络快速入门》中的配置对端设备章节实现本地IDC数据库所在网络和华为云Migration资源组VPC网段（例如172.16

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在本地IDC
MD5校验文件一致性 - 数据治理中心 DataArts Studio

有MD5值的文件至目的端，没有MD5值或者MD5不匹配的数据文件将迁移失败，MD5文件自身不被迁移。若未配置“MD5文件名后缀”，则迁移所有文件。写入时该功能目前只支持目的端为OBS。可校验写入OBS的文件，是否与CDM抽取的文件一致。该功能由目的端作业参数“校验MD5值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
指定文件名迁移 - 数据治理中心 DataArts Studio

指定文件名迁移从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

Linux机器也可以通过IPTABLE实现端口映射。内网中的FTP通过端口映射到公网时，需要检查是否启用了PASV模式。这种情况下客户端和服务端建立连接的时候是走的随机端口，所以除了配置21端口映射外，还需要配置PASV模式的端口范围映射，例如vsftp通过配置pasv_min_

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据库部署在其他云 - 数据治理中心 DataArts Studio

数据库部署在其他云在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在其他云厂商场景下的网络打通方案。图1 网络示意图约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通
查看数据血缘 - 数据治理中心 DataArts Studio

产为节点，单击某一节点名称，可以查看节点的详情。在节点（需是支持血缘的节点类型）详情页面，可以查看节点的血缘信息。单击血缘图中节点左右两端“+”、“-”图标，可以进一步展开查看血缘的上下链路。单击血缘图中的某一个节点，可以查看该节点的详情。进入“作业”页签，单击“编辑”可跳转到数据开发的作业编辑页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
文件格式介绍 - 数据治理中心 DataArts Studio

如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符数据库、NoSQL导出到CSV文件（“使用包围符”在目的端）：当源端某列数据的字符串中出现字段分隔符时，目的端可以通过开启“使用包围符”，将该字符串括起来，作为一

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
跨Region通过云连接连通网络 - 数据治理中心 DataArts Studio

跨Region通过云连接连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组不同Reg

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。默认1000。单次提交行数否指定每次批量提交的行数，根据数据目的端和作业数据规模的大小配置该参数。如果配置过大或过小，可能影响作业的时长。默认10000。单次写入行数否可选参数，指定单次批量写入的行数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

HIVE_3_X 适用组件勾选数据集成后，呈现此参数。 Hive的版本。根据服务端Hive版本设置。说明： HIVE_3_X支持Hive服务端版本为3.x的连接，HIVE_2_X支持Hive服务端版本为2.x的连接。使用不匹配的连接版本，测试连接有可能正常，也可能会出现查询库表为空，或者作业失败等不正常场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
文件格式介绍 - 数据治理中心 DataArts Studio

如果源端指定该参数，则使用指定的编码类型去解析文件；目的端指定该参数，则写入文件的时候，以指定的编码类型写入。使用包围符数据库、NoSQL导出到CSV文件（“使用包围符”在目的端）：当源端某列数据的字符串中出现字段分隔符时，目的端可以通过开启“使用包围符”，将该字符串括起来，作为一

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导

总条数： 413

上一页
1
...
7
8
9
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MD5校验文件一致性 - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

Kafka连接参数说明 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

OBS连接参数说明 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

通过VPN连通网络 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

如何将云下内网或第三方云上的私网与CDM连通？ - 数据治理中心 DataArts Studio

数据库部署在其他云 - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

跨Region通过云连接连通网络 - 数据治理中心 DataArts Studio

新建DataArts Studio与MySQL数据库的连接 - 数据治理中心 DataArts Studio

Apache Hive数据连接参数说明 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线