搜索_华为云

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

目的端作业配置目的连接名称：选择创建云搜索服务连接中的“csslink”。索引：待写入数据的Elasticsearch索引，也可以输入一个新的索引，CDM会自动在云上搜索服务中创建。类型：待写入数据的Elasticsearch类型，可输入新的类型，CDM支持在目的端自动创建类型。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

snapshot.backfill.skip boolean true 全量阶段是否跳过读取binlog数据，默认为true。跳过读取binlog数据可以有效降低内存使用。需要注意的是，跳过读取binlog功能只提供at-least-once保证。表2 增量阶段优化参数参数名类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
创建作业 - 数据治理中心 DataArts Studio

挂起 IGNORE：忽略失败，读取下一事件默认值 : SUSPEND concurrent 否 int 调度并发数取值范围：1~128 默认值：1 readPolicy 否 String 读取策略: LAST ：从上次位置读取 NEW- 从最新位置读取默认值 : LAST 表12

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 作业开发API
配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

持手动填写字段。路由字段允许为空，为空时写入Elasticsearch不指定routing值。 value1 定时创索引对于持续写入数据到Elasticsearch的流式作业，CDM支持在Elasticsearch中定时创建新索引并写入数据，方便用户后期删除过期的数据。支持按以下周期创建新索引：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

暂无优化配置项。目的端优化 DWS写入优化。可通过在DWS的目的端配置中修改写入相关配置，且可以通过单击高级配置的“查看编辑”按钮，添加高级属性。图1 添加高级属性表1 DWS写入优化参数参数名类型默认值说明写入模式 enum UPSERT DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

168.0.1 端口配置为要连接的数据库的端口。默认端口：1521 数据库连接类型选择Oracle数据库连接类型： Service Name：通过SERVICE_NAME连接Oracle数据库。 SID：通过SID连接Oracle数据库。 SID 实例名称配置Oracle实例

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

toJobConfig.createIndexStrategy 否枚举对于持续写入数据到Elasticsearch的流式作业，CDM支持在Elasticsearch中定时创建新索引并写入数据，方便用户后期删除过期的数据。支持按以下周期创建新索引： EveryHour：每小

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
性能调优概述 - 数据治理中心 DataArts Studio

）等情况，需要考虑以下几点：目的端写入过慢。源端抽取过慢。其他问题（请联系技术支持人员协助解决）。因为目的端写入过慢会影响至源端，导致源端抽取速度下降，因此链路速度过慢请优先排查目的端写入速度，在排除目的端因素后再排查上游。目的端写入慢检查目的端负载是否已达到目的端数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
支持的数据源 - 数据治理中心 DataArts Studio

实时同步。支持整库同步的数据源（已支持的数据源即可作为源端，又可作为目的端组成不同链路）如下所示：读取能力：DWS、RDS（MySQL）、RDS（PostgreSQL）写入能力：DWS、DLI 父主题：数据集成（离线作业）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
创建脚本 - 数据治理中心 DataArts Studio

创建脚本功能介绍创建一个新脚本，当前支持的脚本类型有DLI SQL、Flink SQL、RDS SQL、Spark SQL、Hive SQL、DWS SQL、Shell、Presto SQL、ClickHouse SQL、HetuEngine SQL、Python、Spark

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 脚本开发API
文件格式介绍 - 数据治理中心 DataArts Studio

这个主要用于自动化场景中，CDM配置了定时任务，周期去读取源端文件，但此时源端的文件正在生成中，CDM此时读取会造成重复写入或者是读取失败。所以，可以在源端作业参数中指定启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数作业中目的连接为Elasticsearch连接参数说明或云搜索服务（CSS）连接参数说明时，即将数据导入到Elasticsearch/云搜索服务（CSS）时，目的端作业参数如表1所示。表/文件迁移和整库迁移时需配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
文件格式介绍 - 数据治理中心 DataArts Studio

这个主要用于自动化场景中，CDM配置了定时任务，周期去读取源端文件，但此时源端的文件正在生成中，CDM此时读取会造成重复写入或者是读取失败。所以，可以在源端作业参数中指定启动作业标识文件为“ok.txt”，在源端生成文件成功后，再在文件目录下生成“ok.txt”，这样CDM就能读取到完整的文件。另外，可以

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
批量移动API至新目录 - 数据治理中心 DataArts Studio

批量移动API至新目录功能介绍批量移动API至新目录。调用方法请参见如何调用API。 URI POST /v1/{project_id}/service/servicecatalogs/apis/batch-move 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据服务API > 服务目录管理接口
开发SQL脚本 - 数据治理中心 DataArts Studio

支持系统函数功能（当前Flink SQL、Spark SQL、ClickHouse SQL、Presto SQL不支持该功能）。单击编辑器右侧的“系统函数”，显示该数据连接类型支持的函数，您可以双击函数到编辑器中使用。支持可视化读取数据表生成SQL语句功能（当前Flink SQL、Spark

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
节点参考 - 数据治理中心 DataArts Studio

Python MRS ClickHouse MRS HetuEngine MRS Impala SQL MRS Flink Job MRS MapReduce CSS Shell RDS SQL ETL Job Python DORIS SQL GBase SQL ModelArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
实时报警平台搭建 - 数据治理中心 DataArts Studio

我们就可以在DLI中构建告警通知工程。在DLI中创建一个Flink作业，作业名称为“test”。图7 创建Flink SQL作业编辑1中创建的Flink SQL作业，在SQL编辑器中输入语句。图8 编辑Flink SQL作业 SQL语句实现的功能： DIS通过工具上传实时

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
参考：作业分片维度 - 数据治理中心 DataArts Studio

支持按文件分片。 HTTP 支持按文件分片。关系型数据库云数据库 MySQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 PostgreSQL 支持按表字段分片。仅当配置“按表分区抽取”时，按表分区分片。云数据库 SQL Server 支持按表字段分片。仅

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

搜索：Elasticsearch，云搜索服务（CSS） Elasticsearch仅支持非安全模式。云搜索服务（CSS）导入数据到CSS推荐使用Logstash，请参见使用Logstash导入数据到Elasticsearch。上表中非云服务的数据源，例如MySQL，既可以

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 支持的数据源
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle抽取优化。暂无优化配置项。目的端优化 Hudi写入优化。 Hudi表写入性能慢，优先审视表设计是否合理，建议使用Hudi Bucket索引的MOR表，并根据实际数据量配置Bucket桶数，以达到Migration写入性能最佳。使用Bucket索引：通过在“Hudi表属性

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 334

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OBS数据迁移到云搜索服务 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

创建作业 - 数据治理中心 DataArts Studio

配置ElasticSearch目的端参数 - 数据治理中心 DataArts Studio

PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

Oracle数据库连接参数说明 - 数据治理中心 DataArts Studio

目的端为Elasticsearch/云搜索服务 - 数据治理中心 DataArts Studio

性能调优概述 - 数据治理中心 DataArts Studio

支持的数据源 - 数据治理中心 DataArts Studio

创建脚本 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

批量移动API至新目录 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

节点参考 - 数据治理中心 DataArts Studio

实时报警平台搭建 - 数据治理中心 DataArts Studio

参考：作业分片维度 - 数据治理中心 DataArts Studio

支持的数据源（2.9.3.300） - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线