搜索_华为云

使用前必读 - 数据治理中心 DataArts Studio

使用前必读概述调用说明基本概念终端节点Endpoint 项目ID和账号ID 实例ID和工作空间ID 数据资产guid 约束与限制

 帮助中心 > 数据治理中心 DataArts Studio > API参考
调度作业 - 数据治理中心 DataArts Studio

偏移量偏移量的单位为天。输入偏移量的值。输入值必须在-366到366之间。默认为1。当工作空间模式为业务日期模式时，偏移量设置为1时，则表示处理的是昨天的业务数据，偏移量设置为-1时，则表示处理的是明天的业务数据，偏移量设置为0时，则表示处理的是今天的业务数据。业务日

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
管理样本库 - 数据治理中心 DataArts Studio

管理样本库数据安全支持将您提供的OBS或HDFS样本文件生成样本库。当新建随机脱敏或字符替换类型的脱敏算法时，可以选择将敏感数据脱敏为样本库文件中的值。本章主要介绍如何创建样本。前提条件已在OBS或HDFS中上传样本文件。样本文件只支持txt格式，大小建议不超过10MB，其中数据可通过换行“\n”、空格“

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

FTP/SFTP连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型，用户可自定义便于记忆、区分的连接名。 ftp_link 主机名或IP FTP或SFTP服务器的IP地址或者主机名。 ftp.apache.org 端口 FTP或SFTP服务器的端口，FTP默认值为21；SFTP默认值为22。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
管理并查看CDM监控指标 - 数据治理中心 DataArts Studio

管理并查看CDM监控指标 CDM支持的监控指标设置CDM告警规则查看CDM监控指标父主题：创建并管理CDM集群

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
配置Hive源端参数 - 数据治理中心 DataArts Studio

传输模式支持记录迁移和文件迁移默认为记录迁移。仅当源端为Hive2.x且数据存储在HDFS、目的端为Hive3.x且数据存在OBS并行文件系统时，才支持文件迁移。当选择文件迁移时，需保证源端和目的端的表格式和属性需一致才能迁移成功。记录迁移文件迁移分区过滤条件 “读取方式”选择“HDFS”时显示此参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
CDM迁移性能如何？ - 数据治理中心 DataArts Studio

CDM迁移性能如何？单个cdm.large规格实例理论上可以支持1TB～8TB/天的数据迁移，实际传输速率受公网带宽、集群规格、文件读写速度、作业并发数设置、磁盘读写性能等因素影响。更多详情请参见性能白皮书。父主题：数据集成（CDM作业）

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
OBS连接 - 数据治理中心 DataArts Studio

storageType 是 String 对象存储的类型。 linkConfig.obsBucketType 否 String OBS桶类型。对象桶：OB。并行文件系统：PFS。说明：桶类型分为对象桶和并行文件系统，对象桶过滤文件会比较慢，建议客户使用并行文件桶。 linkConfig.server

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 连接参数说明
MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

数据库服务器、端口：配置为RDS上MySQL数据库的连接地址、端口。数据库名称：配置为RDS上MySQL数据库的名称。用户名、密码：登录数据库的用户和密码。创建RDS连接时，“使用本地API”设置为“是”时，可以使用MySQL的LOAD DATA功能加快数据导入，提高导入数据到MySQL的性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

在数据开发主界面，单击左侧导航上的“脚本开发”，进入脚本目录。单击脚本目录中的，选择“显示复选框”。勾选需要导出的脚本，单击 > 导出脚本。导出完成后，即可通过浏览器下载地址，获取到导出的zip文件。图1 选择并导出脚本在弹出的“导出脚本”界面，选择需要导出的脚本的状态，单击“确定”。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

enabled（启用AQE用于倾斜的连接操作，可以通过自动检测倾斜的数据并相应地优化连接算法来提高性能） spark.sql.mergeSmallFiles.enabled（启用合并小文件功能，可以通过将小文件合并成较大的文件来提高性能，可以减少处理许多小文件的时间，并通过减少需要从远程存储中读取的文件数量来提高数据本地性。）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
新建Hadoop集群配置 - 数据治理中心 DataArts Studio

集群配置文件包含集群的配置参数。如果修改了集群的配置参数，需重新获取配置文件。 Keytab文件为认证凭据文件。获取Keytab文件前，需要在集群上至少修改过一次此用户的密码，否则下载获取的keytab文件可能无法使用。另外，修改用户密码后，之前导出的keytab将失效，需要重新导出。 Keyta

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
创建CDM集群 - 数据治理中心 DataArts Studio

创建CDM集群 CDM采用独立集群的方式为用户提供安全可靠的数据迁移服务，各集群之间相互隔离，不可相互访问。 CDM集群可用于如下场景：用于创建并运行数据迁移作业。作为管理中心组件连接数据湖时的Agent代理。前提条件已申请VPC、子网和安全组。CDM集群连接云上其它服务时，需确保CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
字段转换器配置指导 - 数据治理中心 DataArts Studio

SQLServer作为目的端数据源时，不支持timestamp类型字段的写入，需修改为其他时间类型字段写入（如datetime）。当作业源端为OBS、迁移CSV文件时，并且配置“解析首行为列名”参数的场景下显示列名。当使用二进制格式进行文件到文件的迁移时，没有配置字段转换器这一步。自动创表场景下

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

如何使用Java调用CDM的Rest API创建数据迁移作业？ CDM提供了Rest API，可以通过程序调用实现自动化的作业创建或执行控制。这里以CDM迁移MySQL数据库的表city1的数据到DWS的表city2为例，介绍如何使用Java调用CDM服务的REST API创建、启动、查询、删除该CDM作业。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
字段转换器配置指导 - 数据治理中心 DataArts Studio

SQLServer作为目的端数据源时，不支持timestamp类型字段的写入，需修改为其他时间类型字段写入（如datetime）。当作业源端为OBS、迁移CSV文件时，并且配置“解析首行为列名”参数的场景下显示列名。当使用二进制格式进行文件到文件的迁移时，没有配置字段转换器这一步。自动创表场景下

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

数据开发模块作为一站式大数据开发平台，支持多种大数据工具的开发。Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能；可以将SQL语句转换为MapReduce任务进行运行。环境准备已开通MapReduce服务MRS，并创建MRS集群，为Hive

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间创建简单模式工作空间设置工作空间配额（可选）修改作业日志存储路径父主题：购买并配置DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
配置元数据采集任务 - 数据治理中心 DataArts Studio

采集范围选择待采集数据的采集范围。选择“当前文件夹”，采集任务仅采集OBS路径中设置的文件夹下的对象。选择“当前文件夹和所有子文件夹”，采集任务会采集OBS路径中设置的文件夹下所有的对象，包括其子文件夹下的对象采集内容选择待采集数据的采集内容。选择“文件夹和对象”，采集任务采集文件夹和对象。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
目的端为OBS - 数据治理中心 DataArts Studio

枚举重复文件处理方式，只有文件名和文件大小都相同才会判定为重复文件。重复文件支持以下处理方式： REPLACE：替换重复文件。 SKIP：跳过重复文件。 ABANDON：发现重复文件停止任务。 toJobConfig.columnList 否 String 需要抽取的字段列表，

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明

总条数： 1435

上一页
1
...
4
5
6
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用前必读 - 数据治理中心 DataArts Studio

调度作业 - 数据治理中心 DataArts Studio

管理样本库 - 数据治理中心 DataArts Studio

FTP/SFTP连接参数说明 - 数据治理中心 DataArts Studio

管理并查看CDM监控指标 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

CDM迁移性能如何？ - 数据治理中心 DataArts Studio

OBS连接 - 数据治理中心 DataArts Studio

MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

数据开发配置数据搬迁 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

新建Hadoop集群配置 - 数据治理中心 DataArts Studio

创建CDM集群 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

如何使用Java调用CDM的Rest API创建数据迁移作业？ - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

开发一个Hive SQL作业 - 数据治理中心 DataArts Studio

创建并配置简单模式工作空间 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线