搜索_华为云

请求头中参数值长度超过512个字符时，何如处理？ - 数据治理中心 DataArts Studio

的参数值长度超过512个字符时，则不能继续输入，如下图所示。图1 配置请求头参数解决方法配置作业节点的请求头参数。在“参数值”里面引入变量名称，例如{para}。图2 配置请求头参数配置作业参数。单击“作业参数配置”，进入“作业参数配置”界面。在“变量”里面输入该

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？ - 数据治理中心 DataArts Studio

如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？问题描述如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？解决方案 CDM服务暂不支持该操作，建议通过手动导出MySQL的数据文件，然后在服务器上开启SFTP服务，然后新建CDM

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
OBS Manager - 数据治理中心 DataArts Studio

通过节点可以执行的操作：移动文件：将源文件或目录，移动到新目录中。复制文件：复制源文件或目录。重命名文件：重命名文件仅支持最后一级目录或文件重命名。如重命名目录时，源文件或目录：obs://test/a/b/c/，目的目录：obs://test/a/b/d/；重命名文件时，源文件或目录：obs://test/a/b/hello

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

速度摸底。环境信息 CDM集群为xlarge规格，2.9.1 200版本。性能测试中，表数据规格为5000W行100列，HDFS二进制文件数据规格分别为3597W行100列、6667W行100列和10000W行100列。多并发抽取/写入速率，定义为分别取作业抽取并发数为1、

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
引用脚本模板和参数模板的使用介绍 - 数据治理中心 DataArts Studio

使用场景该功能适用于以下场景： Flink SQL脚本可以引用脚本模板。在pipeline作业开发中，MRS Flink Job节点可以使用引入了脚本模板的Flink SQL脚本，同时在MRS Flink Job节点的“运行程序参数”里面可以引用参数模板。在Flink SQL单任务作业中引用脚本模板。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
溯源数据水印 - 数据治理中心 DataArts Studio

描述为更好地识别嵌入水印任务，此处加以描述信息。长度不能超过1024个字符。源文件得到泄露的数据文件后，利用其生成CSV格式文件，注意文件大小不超过20MB。字段分隔符根据上传的CSV文件，下拉选择分隔符，支持四种“,”、“Tab”、“|”、“;”。默认选择“,”。单击“运行”，完成创建数据水印溯源任务。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
迁移准备 - 数据治理中心 DataArts Studio

使用华为云专线搭建CDH集群与华为云VPC之间的专属连接通道。迁移流程预估迁移数据量、迁移时间。输出详细待迁移数据表、文件个数、大小，用于后续校验。分批配置迁移任务，保证迁移进度与速度。校验文件个数以及文件大小。在MRS中恢复HBase表并验证。准备数据项目数据项说明取值示例 DES盒子

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
管理样本库 - 数据治理中心 DataArts Studio

脱敏，则测试算法时限制样本文件大小不能超过10kb。注意，10kb仅为算法测试功能的限制，静态脱敏时并不限制样本文件大小不超过10kb。样本文件大小建议不超过10MB，否则运行需要解析样本文件的静态脱敏任务时，静态脱敏任务可能会失败。 OBS样本文件只能用于DLI引擎的静态脱敏

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
流程设计 - 数据治理中心 DataArts Studio

入流程设计页面。单击流程列表上方的“导入”按钮导入流程。在“导入流程”对话框中，根据页面提示配置如下参数，然后先单击“添加文件”后，再单击“上传文件”。图4 导入流程表2 导入配置参数说明参数名说明更新已有数据如果所要导入的流程，在DataArts Studio数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
源端为FTP/SFTP - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，目前支持以下文件格式： CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

200版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

300版本CDM集群所支持的数据源。因各版本集群支持的数据源有所差异，其他版本支持的数据源仅做参考。表/文件迁移支持的数据源类型表/文件迁移可以实现表或文件级别的数据迁移。表/文件迁移时支持的数据源如表1所示。表1 表/文件迁移支持的数据源数据源分类源端数据源对应的目的端数据源说明数据仓库数据仓库服务（DWS）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
配置模板 - 数据治理中心 DataArts Studio

约束限制该功能适用于以下场景： Flink SQL脚本可以引用脚本模板。在pipeline作业开发中，MRS Flink Job节点可以使用引入了脚本模板的Flink SQL脚本，同时在MRS Flink Job节点的“运行程序参数”里面可以引用参数模板。在Flink SQL单任务作业中引用脚本模板。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
是否支持批量创建作业？ - 数据治理中心 DataArts Studio

CDM可以通过批量导入的功能，实现批量创建作业，方法如下：手动创建一个作业。导出作业，将作业的JSON文件保存到本地。编辑JSON文件，参考该作业的配置，在JSON文件中批量复制出更多作业。将JSON文件导入CDM集群，实现批量创建作业。您也可以参考通过CDM算子批量创建分表迁移作业，配合For

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
导入导出 - 数据治理中心 DataArts Studio

后的表生效。上传模板选择所需导入的文件。所需导入的文件，可以通过以下两种方式获得。下载关系建模导入模板并填写模板在“导入配置”页签内，单击“下载关系建模导入模板”下载模板，然后根据业务需求填写好模板中的相关参数并保存。导出的表文件您可以将某个DataArts Stud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

源连接名称：选择创建MRS HDFS连接中的“hdfs_llink”。源目录或文件：待迁移数据的目录或单个文件路径。文件格式：传输数据时所用的文件格式，这里选择“二进制格式”。不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。其他可选参数一般情况下保持默认即可。目的端作业配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
时间宏变量使用解析 - 数据治理中心 DataArts Studio

时间宏变量使用解析在创建表/文件迁移作业时，CDM支持在源端和目的端的以下参数中配置时间宏变量：源端的源目录或文件源端的表名 “通配符”过滤类型中的目录过滤器和文件过滤器 “时间过滤”中的起始时间和终止时间分区过滤条件和Where子句目的端的写入目录目的端的表名支持

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

在创建表/文件迁移作业时，对简单CSV格式的文件，CDM可以使用字段分隔符进行字段分隔。但是对于一些复杂的半结构化文本，由于字段值也包含了分隔符，所以无法使用分隔符进行字段分隔，此时可以使用正则表达式分隔。正则表达式参数在源端作业参数中配置，要求源连接为对象存储或者文件系统，且“文件格式”必须选择“CSV格式”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导

总条数： 391

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

请求头中参数值长度超过512个字符时，何如处理？ - 数据治理中心 DataArts Studio

如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？ - 数据治理中心 DataArts Studio

OBS Manager - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

引用脚本模板和参数模板的使用介绍 - 数据治理中心 DataArts Studio

溯源数据水印 - 数据治理中心 DataArts Studio

迁移准备 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

流程设计 - 数据治理中心 DataArts Studio

支持的数据源（2.10.0.300） - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

支持的数据源（2.9.2.200） - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

配置模板 - 数据治理中心 DataArts Studio

是否支持批量创建作业？ - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

时间宏变量使用解析 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

正则表达式分隔半结构化文本 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线