搜索_华为云

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

Oracle同步到MRS Hudi作业配置支持的源端和目的端数据库版本表1 支持的数据库版本源端数据库目的端数据库 Oracle数据库（10、11、12、19版本） MRS集群（3.2.0-LTS.x、3.5.x） Hudi版本（0.11.0）数据库账号权限要求在使用Migration

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
步骤3：数据集成 - 数据治理中心 DataArts Studio

步骤3：数据集成本章节将介绍如何使用DataArts Studio数据集成将源数据批量迁移到云上。创建集群批量数据迁移集群提供数据上云和数据入湖的集成能力，全向导式配置和管理，支持单表、整库、增量、周期性数据集成。DataArts Studio基础包中已经包含一个数据集成的集群

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
删除维度表 - 数据治理中心 DataArts Studio

删除维度表功能介绍根据维度表ID，删除维度表。调用方法请参见如何调用API。 URI DELETE /v2/{project_id}/design/dimension-logic-tables 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 维度表接口
解决方案 - 数据治理中心 DataArts Studio

解决方案背景信息解决方案定位于为用户提供便捷的、系统的方式管理作业，更好地实现业务需求和目标。每个解决方案可以包含一个或多个业务相关的作业，一个作业可以被多个解决方案复用。数据开发模块目前支持处理以下几种方式的解决方案。新建解决方案编辑解决方案导出解决方案导入解决方案

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
配置Elasticsearch/云搜索服务源端参数 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务源端参数作业中源连接为Elasticsearch连接参数说明或云搜索服务（CSS）连接参数说明时，源端作业参数如表1所示。表1 Elasticsearch/云搜索服务作为源端时的作业参数参数类型参数名说明取值样例基本参数索引

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优源端优化 MySQL抽取优化。可通过在作业任务配置参数单击中“添加自定义属性”来新增MySQL同步参数。图1 添加自定义属性可使用的调优参数具体如下：表1 全量阶段优化参数参数名类型默认值说明 scan.incremental.snapshot.backfill.skip

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Redis连接参数说明 - 数据治理中心 DataArts Studio

Redis连接参数说明 Redis连接适用于用户在本地数据中心或ECS上自建的Redis，适用于将数据库或文件中的数据加载到Redis。 Redis连接不支持SSL加密的Redis数据源。连接本地Redis数据库时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业前提条件参见新建作业创建一个实时处理的单任务DLI Spark作业。配置DLI Spark作业表1 配置属性参数参数是否必选说明作业名称是输入DLI Spark作业名称。作业名称只能包含英文字母、数字、下划线和中划线，且长度为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
步骤7：数据质量监控 - 数据治理中心 DataArts Studio

步骤7：数据质量监控数据质量监控DQC（Data Quality Control）模块是对数据库里的数据质量进行质量管理的工具。您可从完整性、有效性、及时性、一致性、准确性、唯一性六个维度进行单列、跨列、跨行和跨表的分析。在DataArts Studio数据质量模块中，可以对业务指标和数据质量进行监控

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
数据仓库服务（DWS）连接参数说明 - 数据治理中心 DataArts Studio

数据仓库服务（DWS）连接参数说明连接数据仓库服务（DWS）时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 数据仓库服务（DWS）连接参数参数名说明取值样例名称连接的名称，根据连接的数据源类型

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业对已新建的作业进行开发和配置。开发单任务模式的批处理作业，请您参考开发SQL脚本、配置作业参数、质量监控、数据表、调测并保存作业和下载或转储脚本执行结果章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业后才能继续开发作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据开发API（V1）概览 - 数据治理中心 DataArts Studio

数据开发API（V1）概览表1 数据开发API（V1）类型类型说明连接管理（待下线）连接管理类型接口。说明：连接管理能力由管理中心统一提供，相关接口已不再维护，推荐使用管理中心API进行连接管理。脚本开发脚本开发类型接口。资源管理资源管理类型接口。作业开发

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
订阅动态脱敏策略 - 数据治理中心 DataArts Studio

订阅动态脱敏策略通过动态脱敏订阅，数据安全可以实现同步第三方平台的动态脱敏策略。第三方平台的动态脱敏策略发布到Kafka消息队列后，数据安全进行订阅和消费。消息格式满足要求时，待消息消费成功后，数据安全会生成动态脱敏策略（策略名为Kafka消息中的策略名）并同步到MRS Ranger

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 动态脱敏任务
新建数据质量作业 - 数据治理中心 DataArts Studio

新建数据质量作业质量作业可将创建的规则应用到建好的表中进行质量监控。配置流程在DataArts Studio控制台首页，选择对应工作空间的“数据质量”模块，进入数据质量页面。（可选）选择“数据质量监控 > 质量作业”，新建目录。如果已存在可用的目录，可以不用新建目录。注意，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
数据开发概述 - 数据治理中心 DataArts Studio

数据开发概述数据开发是一个一站式的大数据协同开发平台，提供全托管的大数据调度能力。它可管理多种大数据服务，极大降低用户使用大数据的门槛，帮助您快速构建大数据处理中心。数据开发模块曾被称为数据湖工厂（Data Lake Factory，后简称DLF）服务，因此在本文中，“数据湖工厂

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置操作场景 CDM集群已经创建成功后，您可以查看集群基本信息，并修改集群的配置。查看集群基本信息：集群信息：集群版本、创建时间、项目ID、实例ID和集群ID等。节点配置：集群规格、CPU和内存配置等信息。网络信息：网络配置。支持修改集群的以下配置：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

PostgreSQL/SQLServer连接参数说明连接PostgreSQL/SQLServer时，相关参数如表1所示，金仓和GaussDB数据源可通过PostgreSQL连接器进行连接，支持的迁移作业的源端、目的端情况与PostgreSQL数据源一致。作业运行中禁止修改密码或者更换用户

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
约束与限制 - 数据治理中心 DataArts Studio

约束与限制 CDM系统级限制和约束 DataArts Studio实例赠送的数据集成集群，由于规格限制，仅用于测试业务、数据连接代理场景。用于运行数据迁移作业的其他规格CDM集群可以在DataArts Studio控制台以增量包的形式购买，也可以在云数据迁移CDM服务控制台直接购买

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据备HBase集群中约10TB数据，最近一个月新增的数据量约60TB，总共约70TB。H公司安装的云专线为20GE端口，支持CDM超大规格的集群（cdm.xlarge），综合考虑迁移时间、成本、性能等，这里使用2个CDM超大规格集群并行迁移。CDM集群规格如表

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
迁移作业原理 - 数据治理中心 DataArts Studio

迁移作业原理数据迁移模型 CDM数据迁移时，简化的迁移模型如图1所示。图1 CDM数据迁移模型 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行后，CDM会根据作业配置中的“抽取并发数”参数，将每个作业拆分为多个Task，即作业分片

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能

总条数： 734

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

步骤3：数据集成 - 数据治理中心 DataArts Studio

删除维度表 - 数据治理中心 DataArts Studio

解决方案 - 数据治理中心 DataArts Studio

配置Elasticsearch/云搜索服务源端参数 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Redis连接参数说明 - 数据治理中心 DataArts Studio

开发实时处理单任务DLI Spark作业 - 数据治理中心 DataArts Studio

步骤7：数据质量监控 - 数据治理中心 DataArts Studio

数据仓库服务（DWS）连接参数说明 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

数据开发API（V1）概览 - 数据治理中心 DataArts Studio

订阅动态脱敏策略 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

数据开发概述 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

PostgreSQL/SQLServer连接参数说明 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线