搜索_华为云

导出包含API信息的EXCEL文件 - 数据治理中心 DataArts Studio

导出包含API信息的EXCEL文件功能介绍导出包含API信息的EXCEL文件。调用方法请参见如何调用API。 URI POST /v1/{project_id}/service/export/excel 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
OBS Manager - 数据治理中心 DataArts Studio

通过节点可以执行的操作：移动文件：将源文件或目录，移动到新目录中。复制文件：复制源文件或目录。重命名文件：重命名文件仅支持最后一级目录或文件重命名。如重命名目录时，源文件或目录：obs://test/a/b/c/，目的目录：obs://test/a/b/d/；重命名文件时，源文件或目录：obs://test/a/b/hello

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
全量导出包含API的EXCEL压缩文件 - 数据治理中心 DataArts Studio

表4 响应Body参数参数参数类型描述 - File 导出包含API的EXCEL文件，会导出多个EXCEL文件，每个EXCEL文件最多200个API，多个EXCEL文件会打包到ZIP文件返回。状态码： 400 表5 响应Body参数参数参数类型描述 error_code

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > API管理接口
源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

String 需要解压缩的文件后缀名。当一批文件中以该值为后缀时，才会执行解压缩操作，否则保持原样传输。当输入*或为空时，所有文件都会被解压。 fromJobConfig.fileSeparator 否 String 传输多个文件时，CDM使用这里配置的文件分隔符来区分各个文件，默认为|。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
目的端为OBS - 数据治理中心 DataArts Studio

源端为数据库时该参数有效，支持按大小分成多个文件存储，避免导出的文件过大，单位为MB。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？ - 数据治理中心 DataArts Studio

如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？问题描述如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？解决方案 CDM服务暂不支持该操作，建议通过手动导出MySQL的数据文件，然后在服务器上开启SFTP服务，然后新建CDM

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置HDFS源端参数 - 数据治理中心 DataArts Studio

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

20c8eb05ccc4 准备数据文件“in.txt”，内容为一段英文单词。操作步骤将作业资源包和数据文件传入OBS桶中。本例中，WordCount.jar文件上传路径为：lkj_test/WordCount.jar；word.txt 文件上传路径为：lkj_test/input/word

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
源端为HDFS - 数据治理中心 DataArts Studio

fromJobConfig.splitType 否枚举指定任务分片方式，选择按文件或文件大小进行分割。HDFS上的文件，如果在HDFS上已经分片，则HDFS每个分片视为一个文件。 FILE：按文件数量进行分片。例如有10个文件，并在任务参数中指定“throttlingConfig.numEx

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置OBS目的端参数 - 数据治理中心 DataArts Studio

directory/ 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

txt”，内容为一段英文单词。操作步骤：将脚本和数据文件传入OBS桶中，如下图。图1 上传文件至OBS桶本例中，wordcount.py和in.txt文件上传路径为：obs://obs-tongji/python/ 创建一个数据开发模块空作业，作业名称为“job_MRS_Spark_Python”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置HDFS源端参数 - 数据治理中心 DataArts Studio

Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），文件内容示例如下：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
调度作业 - 数据治理中心 DataArts Studio

位可以配置为秒或分钟。读取策略选择数据的读取位置：从上次位置读取：首次启动时，从最新的位置读取数据。后续启动时，则从前一次记录的位置读取数据。从最新位置读取：每次启动都会从最新的位置读取数据。失败策略选择调度失败后的策略：挂起忽略失败，读取下一个事件是否空跑如

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置OBS源端参数 - 数据治理中心 DataArts Studio

间-偏移量”。 FROM/example.csv 列表文件当“文件格式”选择为“二进制格式”时，才有该参数。打开列表文件功能时，支持读取OBS桶中文件（如txt文件）的内容作为待迁移文件的列表。该文件中的内容应为待迁移文件的绝对路径（不支持目录），例如直接写为如下内容： /052101/DAY20211110

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

/user/output 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为对象存储 - 数据治理中心 DataArts Studio

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置OBS目的端参数 - 数据治理中心 DataArts Studio

Parquet格式：按Parquet格式写入，适用于数据表到文件的迁移。 ORC格式：按ORC格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/SFTP/HDFS/

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

支持记录迁移和文件迁移默认为记录迁移。仅当源端为Hive2.x且数据存储在HDFS、目的端为Hive3.x且数据存在OBS并行文件系统时，才支持文件迁移。当选择文件迁移时，需保证源端和目的端的表格式和属性需一致才能迁移成功。记录迁移文件迁移分区过滤条件 “读取方式”选择“HDFS”时显示此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源

总条数： 394

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

导出包含API信息的EXCEL文件 - 数据治理中心 DataArts Studio

OBS Manager - 数据治理中心 DataArts Studio

全量导出包含API的EXCEL压缩文件 - 数据治理中心 DataArts Studio

源端为HTTP/HTTPS - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？ - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

开发一个MRS Flink作业 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

开发一个MRS Spark Python作业 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

调度作业 - 数据治理中心 DataArts Studio

配置OBS源端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

MRS Hudi连接参数说明 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线