搜索_华为云

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？问题描述 Migration写入数据到Hudi时为了保证稳定性需要将Compaction任务单独拆成Spark作业并交给MRS执行，那么如何进行配置？解决方案修改Migration实时集成作业配置。 Migrati

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、S

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置支持的源端和目的端数据库版本表1 支持的数据库版本源端数据库目的端数据库 MySQL数据库（5.6、5.7、8.x版本） MRS集群（3.2.0-LTS.x） Hudi版本（0.11.0）数据库账号权限要求在使用Migratio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数表1 Kafka作为目的端时的作业参数参数类型参数名说明取值样例基本参数 Topic 输入Topic数据库名称。 default 数据格式写入目的端时使用的数据格式。 CSV：将列按照字段分隔符拼接。 JSON: 将所有列按照指定字段名称拼接为JSON字符串。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置支持的源端和目的端数据库版本表1 支持的数据库版本源端数据库目的端数据库 Kafka集群（2.7、3.x版本） Kafka集群（2.7、3.x版本）数据库账号权限要求在使用Migration进行同步时，源端和目的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优源端优化 MySQL抽取优化可通过在作业任务配置参数单击中“添加自定义属性”来新增MySQL同步参数。图1 添加自定义属性可使用的调优参数具体如下：表1 全量阶段优化参数参数名类型默认值说明 scan.incremental.snapshot

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数作业中源连接为Kafka连接或DMS Kafka连接时，源端作业参数如表1所示。表1 Kafka作为源端时的作业参数参数类型参数说明取值样例基本参数 Topics 支持单个或多个topic。 est1,est2 数据格式解析数据时使用的格式：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
API版本管理 - 数据治理中心 DataArts Studio

API版本管理操作场景数据服务专享版支持将API按照不同版本进行管理，可根据不同的API版本，分别进行调测、发布。您也可以根据API版本追踪API的变更情况，支持版本对比。系统最多保留最近10条的版本记录，更早的版本记录会被删除。前提条件仅专享版支持API版本管理。 A

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 管理API
开发一个Python作业 - 数据治理中心 DataArts Studio

开发一个Python作业本章节介绍如何在数据开发模块上开发并执行Python作业示例。环境准备已开通弹性云服务器，并创建ECS，ECS主机名为“ecs-dgc”。本示例主机选择“CentOS 8.0 64bit with ARM(40GB)”的公共镜像，并且使用ECS自带

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
购买并管理专享版集群 - 数据治理中心 DataArts Studio

购买并管理专享版集群如果您对服务的性能需求不大，可使用共享版数据服务，直接进行新建数据服务审核人，而无需单独购买专享版实例。本小节指导您顺利购买专享版实例，实例创建完成后，才能在数据服务专享版创建API并对外提供服务。如果需要创建、删除专享版集群或修改API配额，则需具备以下权限之一的账号才能进行操作：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
新建码表 - 数据治理中心 DataArts Studio

新建码表码表，也称lookup表、数据字典表，一般由中英文名称编码组成，由可枚举数据构成，存储枚举数据名称与编码的映射关系。码表的作用主要有：在数据清洗中用于标准化业务数据以及补充映射字段。在质量监控中用于监控业务数据的值域范围。在维度建模中可以引申为枚举维度。新建码表并发布

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
配置HDFS目的端参数 - 数据治理中心 DataArts Studio

配置HDFS目的端参数表1 HDFS作为目的端时的作业参数参数类型参数名说明取值样例基本参数写入目录写入数据到HDFS服务器的目录。 /user/cdm/output 文件格式传输数据时使用的格式。其中CSV和JSON仅支持迁移到数据表场景，二进制格式适用于文件迁移场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
购买技术资产数量增量包 - 数据治理中心 DataArts Studio

购买技术资产数量增量包技术资产数量增量包用于扩充技术资产数量配额。不同版本的DataArts Studio实例，默认提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量之和计算的。您可以在新版本模式的DataArts Studio实例卡片上通过“更多 >

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
购买数据模型数量增量包 - 数据治理中心 DataArts Studio

购买数据模型数量增量包数据模型数量增量包用于扩充数据模型数量配额。不同版本的DataArts Studio实例，默认提供了不同的数据模型数量规格限制。该规格是以数据架构中逻辑模型、物理模型、维度表、事实表和汇总表的数量之和计算的。您可以在新版本模式的DataArts Studio实例卡片上通过“更多

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

同Region不同租户通过企业路由器连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为1~64个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数作业中目的连接为Elasticsearch连接参数说明或云搜索服务（CSS）连接参数说明时，即将数据导入到Elasticsearch/云搜索服务（CSS）时，目的端作业参数如表1所示。表/文件迁移和整库迁移时需配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数

总条数： 936

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

MySQL同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

配置Kafka/DMS Kafka源端参数 - 数据治理中心 DataArts Studio

API版本管理 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

购买并管理专享版集群 - 数据治理中心 DataArts Studio

新建码表 - 数据治理中心 DataArts Studio

配置HDFS目的端参数 - 数据治理中心 DataArts Studio

购买技术资产数量增量包 - 数据治理中心 DataArts Studio

购买数据模型数量增量包 - 数据治理中心 DataArts Studio

同Region不同租户通过企业路由器连通网络 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务（CSS）目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线