搜索_华为云

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

管理中心对应的连接信息，避免任务连接失败后自动重试，导致数据库账号被锁定影响使用。支持的同步对象范围在使用Migration进行同步时，不同类型的链路，支持的同步对象范围不同，详细情况可参考下表。表3 同步对象范围类型名称使用须知同步对象范围支持同步的DML：包括I

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
源端为FTP/SFTP - 数据治理中心 DataArts Studio

CDM会将CSV文件的第一行数据作为标题行，不写入目的端的表。 fromJobConfig.fromCompression 否枚举压缩格式，当文件格式为“CSV_FILE”或“JSON”时此参数有效。选择对应压缩格式的源文件： NONE：表示传输所有格式的文件。 GZIP：表示只传输GZIP格式的文件。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

端所使用的数据库账号需要满足以下权限要求，才能启动实时同步任务。不同类型的同步任务，需要的账号权限也不同，详细可参考下表进行赋权。表2 数据库账号权限类型名称权限要求源数据库连接账号数据库的CONNECT权限，模式的USAGE权限，表的SELECT权限，序列的SELEC

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
新建规则 - 数据治理中心 DataArts Studio

所属目录业务规则的存储目录，可选择已创建的目录。目录创建请参见图1。定义关系关系是定义指标和数值间或者指标和指标间的逻辑表达式，可以包含算术运算。指标使用小写字母a-z代替它的缩写，按添加指标的顺序依次为a,b,c,...。说明：只支持一个合法逻辑表达式，支持简单的四则算术运算。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。图1 选取分布列由于分布列的选取，对于DWS/FusionInsight LibrA的运行非常重要，在CDM数据迁移到DWS/FusionInsight LibrA过程中，建议按如下顺序选取分布列：有主键可以使用主键作为分布列。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

输入便于记忆和区分的连接名称。 dwslink 数据库服务器 DWS数据库的IP地址或域名。 192.168.0.3 端口 DWS数据库的端口。 8000 数据库名称 DWS数据库的名称。 db_demo 用户名拥有DWS数据库的读、写和删除权限的用户。 dbadmin 密码用户的密码。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
源端为HDFS - 数据治理中心 DataArts Studio

与加密时配置的“toJobConfig.dek”（导入时配置的数据加密密钥）一致。如果不一致系统不会报异常，只是解密出来的数据会错误。 fromJobConfig.iv 否 String 解密需要的初始化向量，初始化向量由长度32的十六进制数组成，且必须与加密时配置的“toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
创建集群 - 数据治理中心 DataArts Studio

large规格，8核CPU、16G内存的虚拟机。适合单张表规模≥1000万条的场景。 6ddb1072-c5d7-40e0-a874-8a032e81a698：表示cdm.xlarge规格，16核CPU、32G内存的虚拟机。需要10GE高速带宽进行TB以上的数据量迁移时使用。 type 是

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
终端订阅管理 - 数据治理中心 DataArts Studio

如表1所示的参数。图2 添加订阅表1 添加订阅参数参数是否必选说明责任人是设置添加订阅的责任人。责任人是创建作业时所配置的责任人信息。终端协议是短信邮件电话终端信息是设置订阅的终端信息。单击“确定”。终端订阅配置完成后，您可以在通知的“操作”列进行如下操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

各同步场景下选择需要同步库表的方式请参考下表。表5 选择需要同步的库表同步场景配置方式整库选择同步对象。表级同步：支持选择Mysql实例下多个库中的多张表进行同步。库级同步：支持选择Mysql实例下的多个库，对库中的所有表进行同步。选择需要迁移的MySQL库表。图4 选择库表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

是否必选类型说明 toJobConfig.index 是 String 写入数据的索引，类似关系数据库中的数据库名称。 toJobConfig.type 是 String 写入数据的类型，类似关系数据库中的表名。 toJobConfig.shouldClearType 否 Boolean

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
查看作业依赖关系图 - 数据治理中心 DataArts Studio

查看作业依赖关系图您可以通过查看作业依赖关系视图，直观查看该作业关联的上下游作业。前提条件已经在开发Pipeline作业的作业调度配置中设置了依赖作业，否则视图中仅能展示当前作业节点，无法展示具备依赖关系的上下游作业节点。操作步骤参考访问DataArts Studio实例控制台，登录DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

否 Boolean true：源端数据库中的Short、Int、Long、Float、Double、Decimal类型列的数据，会转换为Byte[]数组（二进制）写入HBase，其他类型的按字符串写入。如果这几种类型中，有合并做rowkey的，就依然当字符串写入。该功能作用是：降

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

无该配置项，默认使用源端配置的逻辑表名作为目的端同步的Topic名。同步kafka partition策略支持以下三种投递策略将源端的数据按规则同步到Kafka Topic的特定Partition：全部投递到Partition 0。按库名+表名的hash值投递到不同Partition。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置角色 - 数据治理中心 DataArts Studio

以在展开的导航树中，单击对应数据操作列中的“授权”，进行单一授权。数据视图授权时，系统也提供了“快速模式”和“显示无权限的资源”功能。开启快速模式的情况下，库表列的元数据会从数据目录获取，否则会从数据源获取元数据。已完成元数据采集的场景下推荐开启快速模式。值得注意的是，库、表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

支持以下三种投递策略将源端的数据按规则同步到Kafka Topic的特定Partition：全部投递到Partition 0。按源端分区投递到对应的Partition：源端消息在第n个分区，则投递到目的端的第n个分区，该策略可以保证消息顺序。按轮询模式投递到不同的Partition

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

单击画布上方的运行按钮，运行作业。用户可以查看该作业的运行日志，单击“查看日志”可以进入查看日志界面查看日志的详细信息记录。运行完成后，单击画布上方的保存按钮，保存作业的配置信息。保存后，在右侧的版本里面，会自动生成一个保存版本，支持版本回滚。保存版本时，一分钟内多次保存只

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据集成API概览 - 数据治理中心 DataArts Studio

查询所有可用区查询CDM集群的所有可用区。 cdm_common 查询支持的版本查询CDM集群支持的版本。 cdm_c 查询版本规格按版本ID查询所有兼容规格。 cdm_common 查询规格详情查询指定规格ID的规格详情。 cdm_common 查询所有集群的企业项目ID 查询当前项目下的所有集群的企业项目ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

不同源端数据源的作业分片维度有所不同，因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。 CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数，超出规格的Task排队等待运行。因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
查询流程架构列表 - 数据治理中心 DataArts Studio

响应Body参数参数参数类型描述 data data object data，统一的返回结果的最外层数据结构。表5 data 参数参数类型描述 value value object value，统一的返回结果的外层数据结构。表6 value 参数参数类型描述 total Integer

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 流程架构接口

总条数： 1460

上一页
1
...
20
21
22
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

新建规则 - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

MySQL数据迁移到DWS - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

创建集群 - 数据治理中心 DataArts Studio

终端订阅管理 - 数据治理中心 DataArts Studio

MySQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

查看作业依赖关系图 - 数据治理中心 DataArts Studio

目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

MySQL同步到DMS Kafka作业配置 - 数据治理中心 DataArts Studio

配置角色 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

数据集成API概览 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

查询流程架构列表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线