搜索_华为云

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。每个用户仅允许新增两个访问密钥。为保证访

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
迁移准备 - 数据治理中心 DataArts Studio

obs.cn-north-1.myhuaweicloud.com OBS桶存放CDH一个月前历史数据的OBS桶。 cdm AK/SK 连接OBS的AK/SK。 - MRS Manager IP MRS Manager的IP地址。 192.168.3.11 父主题：车联网大数据零丢失搬迁入湖

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
是否支持同步作业到其他集群？ - 数据治理中心 DataArts Studio

将CDM集群1中的所有作业批量导出，将作业的JSON文件保存到本地。由于安全原因，CDM导出作业时没有导出连接密码，连接密码全部使用“Add password here”替换。在本地编辑JSON文件，将“Add password here”替换为对应连接的正确密码。将编辑好的JSON文件批量导入到CDM集群2，实现集群1和集群2之间的作业同步。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

/user/output 文件格式写入后的文件格式，可选择以下文件格式： CSV格式：按CSV格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
源端为FTP/SFTP - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
OBS连接 - 数据治理中心 DataArts Studio

t Storage Service，简称OBS）抽取或加载文件，支持CSV、JSON和二进制格式。连接样例本示例为连接样例消息体。在实际使用中，AK（accessKey）和SK（securityKey）建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 { "links":

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
溯源数据水印 - 数据治理中心 DataArts Studio

描述为更好地识别嵌入水印任务，此处加以描述信息。长度不能超过1024个字符。源文件得到泄露的数据文件后，利用其生成CSV格式文件，注意文件大小不超过20MB。字段分隔符根据上传的CSV文件，下拉选择分隔符，支持四种“,”、“Tab”、“|”、“;”。默认选择“,”。单击“运行”，完成创建数据水印溯源任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

200版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
是否支持批量创建作业？ - 数据治理中心 DataArts Studio

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
解析响应消息体中的流 - 数据治理中心 DataArts Studio

解析响应消息体中的流导出作业和导出连接的接口响应消息是一个流，需要转化为一个文件。您可以参考下面的样例代码： String EXPORT_JOB_URL = "https://{endpoint}/v1/{project_id}/jobs/{job_name}/export";

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
管理样本库 - 数据治理中心 DataArts Studio

脱敏，则测试算法时限制样本文件大小不能超过10kb。注意，10kb仅为算法测试功能的限制，静态脱敏时并不限制样本文件大小不超过10kb。样本文件大小建议不超过10MB，否则运行需要解析样本文件的静态脱敏任务时，静态脱敏任务可能会失败。 OBS样本文件只能用于DLI引擎的静态脱敏

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
配置OBS目的端参数 - 数据治理中心 DataArts Studio

Parquet格式：按Parquet格式写入，适用于数据表到文件的迁移。 ORC格式：按ORC格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。如果是文件类数据源（FTP/SFTP/HDFS/

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
导入作业 - 数据治理中心 DataArts Studio

"targetStatus": "SUBMITTED", "approvers": [ { "approverName": "userName1" }, { "approverName": "userName2" } ]

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
管理资源 - 数据治理中心 DataArts Studio

字符、“_”、“-”，且长度为1~32个字符。类型是选择资源的文件类型： jar：用户jar文件。 pyFile：用户Python文件。 file：用户文件。 archive：用户AI模型文件。支持的文件后缀名为：zip、tgz、tar.gz、tar、jar。资源位置是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理

总条数： 930

上一页
1
2
3
4
5
...
47
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

迁移准备 - 数据治理中心 DataArts Studio

是否支持同步作业到其他集群？ - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

是否支持批量创建作业？ - 数据治理中心 DataArts Studio

解析响应消息体中的流 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

导入作业 - 数据治理中心 DataArts Studio

管理资源 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线