搜索_华为云

源端为对象存储 - 数据治理中心 DataArts Studio

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置HDFS源端参数 - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，可选择以下文件格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置HDFS源端参数 - 数据治理中心 DataArts Studio

传输数据时所用的文件格式，可选择以下文件格式： CSV格式：以CSV格式解析源文件，用于迁移文件到数据表的场景。二进制格式：选择“二进制格式”时不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。 Parquet格式：以Parquet格式解析源文件，用于HDFS数据导到表的场景。 CSV格式

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
GBASE连接参数说明 - 数据治理中心 DataArts Studio

socketTimeout：配置JDBC连接超时时间，单位为毫秒。 mysql.bool.type.transform：配置mysql读取时，是否将tinyint(1)解析成boolean类型，默认为true。 - 父主题：配置连接参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
图数据自动化构建与分析场景介绍 - 数据治理中心 DataArts Studio

据功能，将图数据（点数据集、边数据集和元数据）定期导入到GES服务中，在GES中对最新数据进行可视化图形分析。场景说明本案例基于某电影网站的用户和评分数据，使用DataArts Studio将MySQL原始数据处理为标准点数据集和边数据集，并同步到OBS和MRS Hive中，然后通过Import

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
源端为FTP/SFTP - 数据治理中心 DataArts Studio

CSV_FILE：CSV格式，用于迁移文件到数据表的场景。 JSON_FILE：JSON格式，一般都是用于迁移文件到数据表的场景。 BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

socketTimeout：配置JDBC连接超时时间，单位为毫秒。 mysql.bool.type.transform：配置mysql读取时，是否将tinyint(1)解析成boolean类型，默认为true。 - 连接私密属性可选参数，单击“显示高级属性”后显示。自定义私密连接属性。 sk=09fUgD5WOF1L6f

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
DMS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

socketTimeout：配置JDBC连接超时时间，单位为毫秒 mysql.bool.type.transform：配置mysql读取时，是否将tinyint(1)解析成boolean类型，默认为true。数据源认证及其他功能配置用户名是开启Kafka SASL_SSL时的必选项。连接DMS Kafka的用户名。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
目的端为HDFS - 数据治理中心 DataArts Studio

写入数据时所用的文件格式（二进制除外），支持以下文件格式： CSV_FILE：按照CSV格式写入数据。 BINARY_FILE：二进制格式，不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式。当选择“BINARY_FILE”时，源端也必须为文件系统。 toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

MS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、分布式、多客户端支持、实时等特性，适用于离线和在线的消息消费，如常规的消息收集、网站活性跟踪、聚合统计系统运营数据（监控数据）、日志收集等大量数据的互联网服务的数据收集场景。 MapReduce服务（MRS Spark）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接操作场景用户在创建数据迁移的任务前，需要先创建连接，让CDM集群能够读写数据源。一个迁移任务，需要建立两个连接，源连接和目的连接。不同的迁移方式（表或者文件迁移），哪些数据源支持导出（即作为源连接），哪些数据源支持导入（即作为目的连接），详情请参见支持的数据源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
数据集成（CDM作业） - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ CDM是否支持动态数据实时迁移功能？ CDM是否支持集群关机功能？如何使用表达式方式获取当前时间？日志提示解析日期格式失败时怎么处理？字段映射界面无法显示所有列怎么处理？ CDM迁移数据到DWS时如何选取分布列？迁移到DWS时出现value too

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
配置HBase/CloudTable源端参数 - 数据治理中心 DataArts Studio

户需要自己手工添加字段。由于HBase的无Schema技术特点，CDM无法获知数据类型，如果数据内容是使用二进制格式存储的，CDM会无法解析。从HBase/CloudTable导出数据时，由于HBase/CloudTable是无Schema的存储系统，CDM要求源端数值型字段

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
DORIS SQL - 数据治理中心 DataArts Studio

本。关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。说明：若选择SQL语句方式，数据开发模块将无法解析您输入SQL语句中携带的参数。数据连接是选择数据连接。数据库是填写数据库名称，该数据库已创建好，建议不要使用默认数据库。表2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
修改资源 - 数据治理中心 DataArts Studio

主Jar包所依赖的JAR包、properties文件。总的长度不能超过10240个字符。同时存在dependFiles和dependPackages时，优先解析该字段。 desc 否 String 描述，长度不能超过255个字符。 directory 是 String 资源所在目录。通过DataArts

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
RDS SQL - 数据治理中心 DataArts Studio

在“SQL脚本”参数后选择需要执行的脚本。如果脚本未创建，请参考新建脚本和开发SQL脚本先创建和开发脚本。说明：若选择SQL语句方式，数据开发模块将无法解析您输入SQL语句中携带的参数。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
GBase SQL - 数据治理中心 DataArts Studio

参数值支持使用EL表达式。若关联的SQL脚本，脚本参数发生变化，可单击刷新按钮同步。说明：若选择SQL语句方式，数据开发模块将无法解析您输入SQL语句中携带的参数。数据连接是选择数据连接。数据库是选择数据库名称，该数据库已创建好，建议不要使用默认数据库。表2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
共享版与专享版数据服务的对比 - 数据治理中心 DataArts Studio

共享版与专享版数据服务的对比共享版与专享版对比数据服务当前提供共享版与专享版两种服务方式。其中共享版数据服务即开即用但仅限于存量用户调测使用，专享版数据服务需要购买专享版集群增量包并在集群中管理API。数据服务共享版当前仅限于华东-上海一、华北-北京四、华南-广州的存量用户

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
文件增量迁移 - 数据治理中心 DataArts Studio

文件过滤器：配置为“*${dateformat(yyyyMMdd,-1,DAY)}*”（这是CDM支持的日期宏变量格式，详见时间宏变量使用解析）。图1 文件过滤配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践 > 增量迁移原理介绍
文件增量迁移 - 数据治理中心 DataArts Studio

文件过滤器：配置为“*${dateformat(yyyyMMdd,-1,DAY)}*”（这是CDM支持的日期宏变量格式，详见时间宏变量使用解析）。图1 文件过滤配置作业定时自动执行，“重复周期”为1天。这样每天就可以把昨天生成的文件都导入到目的端目录，实现增量同步。文件增

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导 > 增量迁移原理介绍

总条数： 665

上一页
1
2
3
4
5
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

源端为对象存储 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

GBASE连接参数说明 - 数据治理中心 DataArts Studio

图数据自动化构建与分析场景介绍 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

DMS Kafka数据连接参数说明 - 数据治理中心 DataArts Studio

目的端为HDFS - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

数据集成（CDM作业） - 数据治理中心 DataArts Studio

配置HBase/CloudTable源端参数 - 数据治理中心 DataArts Studio

DORIS SQL - 数据治理中心 DataArts Studio

修改资源 - 数据治理中心 DataArts Studio

RDS SQL - 数据治理中心 DataArts Studio

GBase SQL - 数据治理中心 DataArts Studio

共享版与专享版数据服务的对比 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

文件增量迁移 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线