搜索_华为云

创建MySQL连接器 - 数据治理中心 DataArts Studio

在本地数据中心或ECS上自建的MySQL。本教程为您介绍如何创建MySQL连接器。前提条件已获取连接MySQL数据库的IP地址、端口、数据库名称、用户名、密码，且该用户拥有MySQL数据库的读写权限。本地MySQL数据库可通过公网访问。如果MySQL服务器是在本地数据中心或

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
OBS连接参数说明 - 数据治理中心 DataArts Studio

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件： CDM集群与云上服务处于不同区域的情况下，需要通过公网或者

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接
上传存量数据 - 数据治理中心 DataArts Studio

路径，CDM会将文件写入到该路径下。文件格式：与源端一样，选择“二进制格式”，原始文件自身的格式不会改变。重复文件处理方式：这里选择“跳过重复文件”。只有当源端和目的端存在文件名、文件大小都相同的文件时，CDM才会判定该文件为重复文件，这时CDM将跳过该文件，不迁移到OBS。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析 > 使用CDM上传数据到OBS
参考：作业分片维度 - 数据治理中心 DataArts Studio

Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。 Apache HDFS 支持按文件分片。 Apache HBase 支持按HBase的Region分片。 Apache Hive HDFS读取方式时，支持按Hive文件分片。 JDBC读取方式时，不支持分片。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 优化迁移性能
状态码 - 数据治理中心 DataArts Studio

Failed 未满足前提条件，服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大，服务器无法处理，因此拒绝请求。为防止客户端的连续请求，服务器可能会关闭连接。如果只是服务器暂时无法处理，则会包含一个Retry-After的响应信息。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录
贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍使用云数据迁移（Cloud Data Migration，简称CDM）将本地贸易统计数据导入到OBS，再使用数据湖探索（Data Lake Insight，简称DLI）进行贸易统计分析，帮助H咨询公司以极简、极低成本构建其大数据分析平台，使得该公司更好地聚焦业务，持续创新。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 贸易数据极简上云与统计分析
配置CDM作业字段映射 - 数据治理中心 DataArts Studio

可以通过字段映射界面的可自定义新增字段，也可单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。其他场景下，CDM会自动匹配源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业
开发Python脚本 - 数据治理中心 DataArts Studio

已新增Python脚本，请参见新建脚本。已新建主机连接，该Linux主机配有用于执行Python脚本的环境。新建主机连接请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/ss

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
源端为HDFS - 数据治理中心 DataArts Studio

fromJobConfig.splitType 否枚举指定任务分片方式，选择按文件或文件大小进行分割。HDFS上的文件，如果在HDFS上已经分片，则HDFS每个分片视为一个文件。 FILE：按文件数量进行分片。例如有10个文件，并在任务参数中指定“throttlingConfig.numEx

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置HTTP源端参数 - 数据治理中心 DataArts Studio

com/object-key 列表文件选择“是”，将待上传的文本文件中所有URL对应的文件拉取到OBS，文本文件记录的是HDFS上的文件路径。是列表文件源连接文本文件存储在OBS桶中，这里需要选择已建立的OBS连接。 obs_link 列表文件OBS桶存储文本文件的OBS桶名称。 obs-cdm

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建作业 > 配置CDM作业源端参数
（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

c86687baf85c 通过SDK调用API 解压1中获取的Java SDK包，并在Eclipse中导入SDK工程。导入成功后，打开main.java文件，修改如下图红框所示的内容：图4 修改main.java 如下参数设置API的请求方法和调用地址，可参考5进行获取。注

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
源端为FTP/SFTP - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
常见错误码参考 - 数据治理中心 DataArts Studio

0411 连接到文件服务器时出错。请联系客服或技术支持人员协助解决。 Cdm.0412 与文件服务器断开连接时出错。请联系客服或技术支持人员协助解决。 Cdm.0413 向文件服务器传输数据时出错。请联系客服或技术支持人员协助解决。 Cdm.0415 从文件服务器下载文件出错。请联系客服或技术支持人员协助解决。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

名称：用户自定义连接名称，例如“oracle_link”。数据库服务器地址、端口：配置为Oracle服务器的地址、端口。数据库名称：选择要导出数据的Oracle数据库名称。用户名、密码：Oracle数据库的登录用户名和密码，该用户需要拥有Oracle元数据的读取权限。单击“保存”回到连接管理界面。创建迁移作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 使用教程
溯源数据水印 - 数据治理中心 DataArts Studio

描述为更好地识别嵌入水印任务，此处加以描述信息。长度不能超过1024个字符。源文件得到泄露的数据文件后，利用其生成CSV格式文件，注意文件大小不超过20MB。字段分隔符根据上传的CSV文件，下拉选择分隔符，支持四种“,”、“Tab”、“|”、“;”。默认选择“,”。单击“运行”，完成创建数据水印溯源任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
Redis连接参数说明 - 数据治理中心 DataArts Studio

Single：表示单机部署。 Cluster：表示集群部署。 Proxy：表示通过代理部署。 Single Redis服务器列表 Redis服务器地址列表，输入格式为“数据库服务器域名或IP地址：端口”。多个服务器列表间以“;”分隔。 192.168.0.1:7300;192.168.0.2:7301 密码

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数
源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

String 需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 fromJobConfig.fileSeparator 否 String 传输多个文件时，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
是否支持批量创建作业？ - 数据治理中心 DataArts Studio

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成
云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 css_link Elasticsearch服务器列表配置为一个或多个Elasticsearch服务器的IP地址或域名，包括端口号，格式为“ip:port”，多个地址之间使用“;”分隔。 192.168.0.1:9200;192

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 在CDM集群中创建连接 > 配置连接参数

总条数： 736

上一页
1
2
3
4
5
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建MySQL连接器 - 数据治理中心 DataArts Studio

OBS连接参数说明 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

上传存量数据 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

状态码 - 数据治理中心 DataArts Studio

贸易数据上云场景介绍 - 数据治理中心 DataArts Studio

配置CDM作业字段映射 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

配置HTTP源端参数 - 数据治理中心 DataArts Studio

（推荐）通过SDK调用APP认证方式的API - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

常见错误码参考 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

Redis连接参数说明 - 数据治理中心 DataArts Studio

源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

是否支持批量创建作业？ - 数据治理中心 DataArts Studio

云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线