搜索_华为云

脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍该章节介绍如何在脚本及作业中引用参数，以及引用后的生效范围、是否支持EL表达式和简易变量集等，让您更加清晰地了解工作空间级和脚本、作业级配置参数的使用方法。工作空间环境变量参数、作业参数、脚本参数均可以配置参数，但作用范围不同；另外如果工作空间环境

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？问题描述 Migration写入数据到Hudi时为了保证稳定性需要将Compaction任务单独拆成Spark作业并交给MRS执行，那么如何进行配置？解决方案修改Migration实时集成作业配置。 Migrati

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
DLI SQL - 数据治理中心 DataArts Studio

DLI SQL 功能通过DLI SQL节点传递SQL语句到DLI SQL中执行，实现多数据源分析探索。原理该节点方便用户在数据开发模块的周期与实时调度中执行DLI相关语句，可以使用参数变量为用户的数仓进行增量导入，分区处理等动作。参数用户可参考表1，表2和表3配置DLI

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
配置模板 - 数据治理中心 DataArts Studio

配置模板本章节主要介绍如何创建并使用模板。用户在编写业务代码时，对于重复的业务逻辑，可以直接引用SQL模板，同时在配置作业运行参数的时候，可以直接使用作业参数模板，不用再进行重复配置。约束限制该功能适用于以下场景： Flink SQL脚本可以引用脚本模板。在pipeline作业开发中，MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
备份管理 - 数据治理中心 DataArts Studio

备份管理通过备份功能，您可定时备份系统中的所有作业、脚本、资源和环境变量。通过还原功能，您可还原已备份的资产，包含作业、脚本、资源和环境变量。约束限制该功能依赖于OBS服务。当前备份内容不会自动老化删除，您需要定期手动清理备份文件。前提条件已开通对象存储服务，并在OBS中创建文件夹。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数表1 Kafka作为目的端时的作业参数参数类型参数名说明取值样例基本参数 Topic 输入Topic数据库名称。 default 数据格式写入目的端时使用的数据格式。 CSV：将列按照字段分隔符拼接。 JSON: 将所有列按照指定字段名称拼接为JSON字符串。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业对已新建的作业进行开发和配置。开发单任务模式的批处理作业，请您参考开发SQL脚本、配置作业参数、质量监控、数据表、调测并保存作业和下载或转储脚本执行结果章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数作业中源连接为Kafka连接或DMS Kafka连接时，源端作业参数如表1所示。表1 Kafka作为源端时的作业参数参数类型参数说明取值样例基本参数 Topics 支持单个或多个topic。 est1,est2 数据格式解析数据时使用的格式：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
数据集成概述 - 数据治理中心 DataArts Studio

数据集成概述 DataArts Studio数据集成是一种高效、易用的数据集成服务，围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。数据集成即云数据迁移（Cloud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优源端优化 MySQL抽取优化可通过在作业任务配置参数单击中“添加自定义属性”来新增MySQL同步参数。图1 添加自定义属性可使用的调优参数具体如下：表1 全量阶段优化参数参数名类型默认值说明 scan.incremental.snapshot

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
API版本管理 - 数据治理中心 DataArts Studio

API版本管理操作场景数据服务专享版支持将API按照不同版本进行管理，可根据不同的API版本，分别进行调测、发布。您也可以根据API版本追踪API的变更情况，支持版本对比。系统最多保留最近10条的版本记录，更早的版本记录会被删除。前提条件仅专享版支持API版本管理。 A

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 管理API
开发一个Python作业 - 数据治理中心 DataArts Studio

开发一个Python作业本章节介绍如何在数据开发模块上开发并执行Python作业示例。环境准备已开通弹性云服务器，并创建ECS，ECS主机名为“ecs-dgc”。本示例主机选择“CentOS 8.0 64bit with ARM(40GB)”的公共镜像，并且使用ECS自带

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为1~64个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数作业中目的连接为Elasticsearch连接参数说明或云搜索服务（CSS）连接参数说明时，即将数据导入到Elasticsearch/云搜索服务（CSS）时，目的端作业参数如表1所示。表/文件迁移和整库迁移时需配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
配置OBS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数支持使用CSV、CarbonData或二进制格式批量传输大量文件到OBS。表1 OBS作为目的端时的作业参数参数类型参数名说明取值样例基本参数桶名写入数据的OBS桶名。 bucket_2 写入目录写入数据到OBS服务器的目录，目录前面不加“/”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
新建数据表 - 数据治理中心 DataArts Studio

新建数据表您可以通过可视化模式、DDL模式或SQL脚本方式新建数据表。（推荐）可视化模式：您可以直接在DataArts Studio数据开发模块通过No Code方式，新建数据表。（推荐）DDL模式：您可以在DataArts Studio数据开发模块，通过选择DDL方式，使用SQL语句新建数据表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 数据管理

总条数： 977

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

DLI SQL - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

配置模板 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

API版本管理 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

新建数据表 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线