搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置模板 - 数据治理中心 DataArts Studio

配置模板本章节主要介绍如何创建并使用模板。用户在编写业务代码时，对于重复的业务逻辑，可以直接引用SQL模板，同时在配置作业运行参数的时候，可以直接使用作业参数模板，不用再进行重复配置。约束限制该功能适用于以下场景： Flink SQL脚本可以引用脚本模板。在pipeline

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
调试API - 数据治理中心 DataArts Studio

调试API 操作场景 API创建后需要验证服务是否正常，管理控制台提供调试功能，您可以添加HTTP头部参数与body体参数，调试API接口。后端路径中含有环境变量的API，不支持调试。 API绑定签名密钥时，不支持调试。如果API已绑定流控策略，在调试API时，流控策略无效。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API
车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍场景描述为搭建H公司车联网业务集团级的云管理平台，统一管理、部署硬件资源和通用类软件资源，实现IT应用全面服务化、云化，CDM（Cloud Data Migration，简称CDM）助力H公司做到代码“0”改动、数据“0”丢失迁移上云。约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？问题描述 Migration写入数据到Hudi时为了保证稳定性需要将Compaction任务单独拆成Spark作业并交给MRS执行，那么如何进行配置？解决方案修改Migration实时集成作业配置。 Migration

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（实时作业）
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、SFTP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
DLI SQL - 数据治理中心 DataArts Studio

DLI SQL 功能通过DLI SQL节点传递SQL语句到DLI SQL中执行，实现多数据源分析探索。原理该节点方便用户在数据开发模块的周期与实时调度中执行DLI相关语句，可以使用参数变量为用户的数仓进行增量导入，分区处理等动作。参数用户可参考表1，表2和表3配置DLI

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何在数据开发模块中提交一个

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
备份管理 - 数据治理中心 DataArts Studio

备份管理通过备份功能，您可定时备份系统中的所有作业、脚本、资源和环境变量。通过还原功能，您可还原已备份的资产，包含作业、脚本、资源和环境变量。约束限制该功能依赖于OBS服务。当前备份内容不会自动老化删除，您需要定期手动清理备份文件。前提条件已开通对象存储服务，并在OBS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
数据集市 - 数据治理中心 DataArts Studio

数据集市数据集市，也称为DM模型。是汇总表的统称。汇总逻辑表是由一个特定的分析对象（如会员）及其相关的统计指标组成的。组成一个汇总逻辑表的统计指标都具有相同的统计粒度（如会员），汇总逻辑表面向用户提供了以统计粒度（如会员）为主题的所有统计数据（如会员主题集市）。汇总表分为“手工创建

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置支持的源端和目的端数据库版本表1 支持的数据库版本源端数据库目的端数据库 Kafka集群（2.7、3.x版本） - 数据库账号权限要求在使用Migration进行同步时，源端和目的端所使用的数据库账号需要满足以下权限要求，才能启动实时同步任务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？ - 数据治理中心 DataArts Studio

查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？问题现象查看数据开发的节点日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限”，如下图所示：图1 提示信息原因分析数据开发的日志存储在OBS桶中

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数表1 Kafka作为目的端时的作业参数参数类型参数名说明取值样例基本参数 Topic 输入Topic数据库名称。 default 数据格式写入目的端时使用的数据格式。 CSV：将列按照字段分隔符拼接。 JSON: 将所有列按照指定字段名称拼接为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优源端优化 MySQL抽取优化可通过在作业任务配置参数单击中“添加自定义属性”来新增MySQL同步参数。图1 添加自定义属性可使用的调优参数具体如下：表1 全量阶段优化参数参数名类型默认值说明 scan.incremental.snapshot.backfill.skip

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业对已新建的作业进行开发和配置。开发单任务模式的批处理作业，请您参考开发SQL脚本、配置作业参数、质量监控、数据表、调测并保存作业和下载或转储脚本执行结果章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业后才能继续开发作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
API版本管理 - 数据治理中心 DataArts Studio

API版本管理操作场景数据服务专享版支持将API按照不同版本进行管理，可根据不同的API版本，分别进行调测、发布。您也可以根据API版本追踪API的变更情况，支持版本对比。系统最多保留最近10条的版本记录，更早的版本记录会被删除。前提条件仅专享版支持API版本管理。 API

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 管理API
数据集成概述 - 数据治理中心 DataArts Studio

数据集成概述 DataArts Studio数据集成是一种高效、易用的数据集成服务，围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。数据集成即云数据迁移（Cloud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）

总条数： 893

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

配置模板 - 数据治理中心 DataArts Studio

调试API - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

如何配置Hudi Compaction的Spark周期任务？ - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

DLI SQL - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

数据集市 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？ - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

API版本管理 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线