搜索_华为云

产品功能 - 数据治理中心 DataArts Studio

据。字段转换支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。文件加密在迁移文件到文件系统时，数据集成支持对写入云端的文件进行加密。 MD5校验一致性支持使用MD5校验，检查端到端文件的一致性，并输出校验结果。脏数据归档支持将迁移过程中处理失败的、被清洗过滤

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
事务模式迁移 - 数据治理中心 DataArts Studio

事务模式迁移 CDM的事务模式迁移，是指当CDM作业执行失败时，将数据回滚到作业开始之前的状态，自动清理目的表中的数据。参数位置：创建表/文件迁移的作业时，如果目的端为关系型数据库，在目的端作业配置的高级属性中，可以通过“先导入阶段表”参数选择是否启用事务模式。参数原理：如果启

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
数据集成API错误码 - 数据治理中心 DataArts Studio

400 连接到文件服务器时出错。连接到文件服务器时出错。请联系客服或技术支持人员协助解决。 Cdm.0413 400 向文件服务器传输数据时出错。向文件服务器传输数据时出错。请联系客服或技术支持人员协助解决。 Cdm.0415 400 从文件服务器下载文件出错。从文件服务器下载文件出错。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
步骤2：数据集成 - 数据治理中心 DataArts Studio

新增访问密钥”，如图3所示。图3 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
MRS Hudi数据连接参数说明 - 数据治理中心 DataArts Studio

新增访问密钥”，如图1所示。图1 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
开发SQL脚本 - 数据治理中心 DataArts Studio

spark.sql.mergeSmallFiles.enabled（启用合并小文件功能，可以通过将小文件合并成较大的文件来提高性能，可以减少处理许多小文件的时间，并通过减少需要从远程存储中读取的文件数量来提高数据本地性。）如果不使用的话，可以手动配置相关参数进行关闭，参数值设置为false。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
步骤3：数据集成 - 数据治理中心 DataArts Studio

新增访问密钥”，如图5所示。图5 单击新增访问密钥单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
Shell - 数据治理中心 DataArts Studio

数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度频率合理配置MaxSessions的值。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell和Python脚本都是发往

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据集成应用示例 - 数据治理中心 DataArts Studio

BYTES_READ：表示读取的字节数。 TOTAL_FILES：表示总文件数。 FILES_WRITTEN：表示写入的文件数。 FILES_READ：表示读取的文件数。 ROWS_WRITTEN：表示写入成功的行数。 ROWS_READ：表示读取成功的行数。父主题：应用示例

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
开发Python脚本 - 数据治理中心 DataArts Studio

请参见主机连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
Cassandra连接参数说明 - 数据治理中心 DataArts Studio

连接Cassandra的密码。 - 连接超时时长可选参数，单击“显示高级属性”后显示。连接超时时长，单位秒。 5 读取超时时长可选参数，单击“显示高级属性”后显示。读取超时时长，单位秒。小于或等于0表示不超时。 12 父主题：配置连接参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

数据库名称：选择要导出数据的Oracle数据库名称。用户名、密码：Oracle数据库的登录用户名和密码，该用户需要拥有Oracle元数据的读取权限。单击“保存”回到连接管理界面。创建迁移作业选择“表/文件迁移 > 新建作业”，开始创建从Oracle导出数据到云搜索服务的任务。图4 创建Oracle到云搜索服务的迁移任务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

snapshot.backfill.skip boolean true 全量阶段是否跳过读取binlog数据，默认为true。跳过读取binlog数据可以有效降低内存使用。需要注意的是，跳过读取binlog功能只提供at-least-once保证。 scan.incremental

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
步骤1：数据准备 - 数据治理中心 DataArts Studio

需手动重新调整为单行）。单击“文件 > 另存为”，在弹出的对话框中，“保存类型”选择为“所有文件(*.*)”，在“文件名”处输入文件名和.csv后缀，选择“UTF-8”编码格式（不能带BOM），则能以CSV格式保存该文件。将源数据CSV文件上传到OBS服务。登录控制台，选择“存储

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

已参见表1获取相应Hadoop集群配置文件和Keytab文件。获取集群配置文件和Keytab文件不同Hadoop类型的集群配置文件和Keytab文件获取方式有所不同，请参见表1获取相应Hadoop集群配置文件和Keytab文件。表1 集群配置文件和Keytab文件获取方式 Hadoop类型连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
RDS数据连接参数说明 - 数据治理中心 DataArts Studio

huawei.opengauss.jdbc.Driver：连接GaussDB数据源时，选择此驱动程序名称。驱动文件来源是选择驱动文件的来源方式。驱动文件路径是驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。 MySQL驱动：获取地址https://downloads

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
查询作业 - 数据治理中心 DataArts Studio

jobType=NORMAL_JOB：表示查询表/文件迁移的作业。 jobType=BATCH_JOB：表示查询整库迁移的作业。 jobType=SCENARIO_JOB：表示查询场景迁移的作业。不指定该参数时，默认只查询表/文件迁移的作业。请求参数表3 请求Header参数

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
操作环境与数据准备 - 数据治理中心 DataArts Studio

需要先将样例数据存储为CSV文件，将CSV文件上传至OBS服务中。创建CSV文件（UTF-8无bom格式），文件名称为对应的数据表名，将后文提供的各样例数据分别复制粘贴到不同CSV文件中，然后保存CSV文件。以下是Windows下生成.csv文件的办法之一：使用文本编辑工具

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 图数据自动化构建与分析
Doris数据连接参数说明 - 数据治理中心 DataArts Studio

驱动程序名称，目前支持MySQL jdbc驱动，驱动名为：com.mysql.jdbc.Driver。驱动文件来源是选择驱动文件的来源方式。驱动文件路径是 “驱动文件来源”选择“OBS路径”时配置。驱动文件在OBS上的路径。需要您自行到官网下载.jar格式驱动并上传至OBS中。 MySQL驱

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
目的端为HDFS - 数据治理中心 DataArts Studio

将二进制文件先写入到临时文件（临时文件以“.tmp”作为后缀），迁移成功后，再进行rename或move操作，在目的端恢复文件。 toJobConfig.duplicateFileOpType 否枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明

总条数： 394

上一页
1
...
8
9
10
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

产品功能 - 数据治理中心 DataArts Studio

事务模式迁移 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

步骤2：数据集成 - 数据治理中心 DataArts Studio

MRS Hudi数据连接参数说明 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

Shell - 数据治理中心 DataArts Studio

数据集成应用示例 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

Cassandra连接参数说明 - 数据治理中心 DataArts Studio

Oracle数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

MySQL到DMS Kafka参数调优 - 数据治理中心 DataArts Studio

步骤1：数据准备 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

RDS数据连接参数说明 - 数据治理中心 DataArts Studio

查询作业 - 数据治理中心 DataArts Studio

操作环境与数据准备 - 数据治理中心 DataArts Studio

Doris数据连接参数说明 - 数据治理中心 DataArts Studio

目的端为HDFS - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线