搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
关联质量规则 - 数据治理中心 DataArts Studio

关联质量规则当您完成表的新建和发布后，您可以在表中关联质量规则。在“配置中心 > 功能配置”页面中的“模型设计业务流程步骤 > 创建质量作业”勾选的情况下，完成质量规则的关联后，表发布后就会在DataArts Studio数据质量中自动创建质量作业，如果当前表已经发布，则系统会自动更新质量作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍该章节介绍如何在脚本及作业中引用参数，以及引用后的生效范围、是否支持EL表达式和简易变量集等，让您更加清晰地了解工作空间级和脚本、作业级配置参数的使用方法。工作空间环境变量参数、作业参数、脚本参数均可以配置参数，但作用范围不同；另外如果工作空间环境变量参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
配置模板 - 数据治理中心 DataArts Studio

配置模板本章节主要介绍如何创建并使用Flink SQL模板。用户在编写Flink SQL业务代码时，对于重复的业务逻辑，可以直接引用sql模板，同时在配置作业运行参数的时候，可以直接使用作业参数模板，不用再进行重复配置。约束限制该功能适用于以下场景： Flink SQL脚本可以引用脚本模板

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、SFTP

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
常见错误码参考 - 数据治理中心 DataArts Studio

常见错误码参考如果操作请求在执行过程中出现异常导致未被处理，则会返回一条错误信息。错误信息中包括错误码和具体错误描述。表1列出了错误信息中的常见错误码。您可以通过表1中的处理建议进行下一步操作，处理相应的异常。错误码说明表1 错误码说明错误码错误信息处理建议 Cdm.0000

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何在数据开发模块中提交一个

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
数据集市 - 数据治理中心 DataArts Studio

数据集市数据集市，也称为DM模型。是汇总表的统称。汇总逻辑表是由一个特定的分析对象（如会员）及其相关的统计指标组成的。组成一个汇总逻辑表的统计指标都具有相同的统计粒度（如会员），汇总逻辑表面向用户提供了以统计粒度（如会员）为主题的所有统计数据（如会员主题集市）。汇总表分为“手工创建

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
MD5校验文件一致性 - 数据治理中心 DataArts Studio

MD5校验文件一致性 CDM数据迁移以抽取-写入模式进行，CDM首先从源端抽取数据，然后将数据写入到目的端。在迁移文件到OBS时，迁移模式如图1所示。图1 迁移文件到OBS 在这个过程中，CDM支持使用MD5检验文件一致性。抽取时该功能支持源端为OBS、HDFS、FTP、SFTP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍场景描述为搭建H公司车联网业务集团级的云管理平台，统一管理、部署硬件资源和通用类软件资源，实现IT应用全面服务化、云化，CDM（Cloud Data Migration，简称CDM）助力H公司做到代码“0”改动、数据“0”丢失迁移上云。约束限制

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
DLI SQL - 数据治理中心 DataArts Studio

DLI SQL 功能通过DLI SQL节点传递SQL语句到DLI SQL中执行，实现多数据源分析探索。原理该节点方便用户在数据开发模块的周期与实时调度中执行DLI相关语句，可以使用参数变量为用户的数仓进行增量导入，分区处理等动作。参数用户可参考表1，表2和表3配置DLI

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 管理工作空间
设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额使用DataArts Studio前，您需要为当前工作空间设置工作空间配额（当前仅支持数据服务专享版API配额）。如果当前工作空间的“已使用配额”超出“已分配配额”，或者“总使用配额”超出“总分配配额”，则会导致相应业务使用受限，例如无法再新建数据服务专享版API

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 创建并配置简单模式工作空间
备份管理 - 数据治理中心 DataArts Studio

备份管理通过备份功能，您可定时备份系统中的所有作业、脚本、资源和环境变量。通过还原功能，您可还原已备份的资产，包含作业、脚本、资源和环境变量。约束限制该功能依赖于OBS服务。当前备份内容不会自动老化删除，您需要定期手动清理备份文件。前提条件已开通对象存储服务，并在OBS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？ - 数据治理中心 DataArts Studio

查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？问题现象查看数据开发的节点日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限”，如下图所示：图1 提示信息原因分析数据开发的日志存储在OBS桶中

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数表1 Kafka作为目的端时的作业参数参数类型参数名说明取值样例基本参数 Topic 输入Topic数据库名称。 default 数据格式写入目的端时使用的数据格式。 CSV：将列按照字段分隔符拼接。 JSON: 将所有列按照指定字段名称拼接为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发 > 配置作业目的端参数
配置实时网络连接 - 数据治理中心 DataArts Studio

配置实时网络连接实时迁移任务配置前，您需要确保用于执行迁移任务的资源组与您将要同步的数据来源端与目的端数据库的网络连通性，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中时，可选用的网络连通方案。操作场景 DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 管理DataArts Studio资源
开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业对已新建的作业进行开发和配置。开发单任务模式的批处理作业，请您参考开发SQL脚本、配置作业参数、质量监控、数据表、调测并保存作业和下载或转储脚本执行结果章节。前提条件已创建作业，详情请参见新建作业。当前用户已锁定该作业，否则需要通过“抢锁”锁定作业后才能继续开发作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发
数据集成概述 - 数据治理中心 DataArts Studio

数据集成概述 DataArts Studio数据集成是一种高效、易用的数据集成服务，围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。数据集成即云数据迁移（Cloud

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成

总条数： 866

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

关联质量规则 - 数据治理中心 DataArts Studio

脚本及作业中引用参数使用介绍 - 数据治理中心 DataArts Studio

配置模板 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

常见错误码参考 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

数据集市 - 数据治理中心 DataArts Studio

MD5校验文件一致性 - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

DLI SQL - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

设置工作空间配额 - 数据治理中心 DataArts Studio

备份管理 - 数据治理中心 DataArts Studio

查看日志时，系统提示“OBS日志文件不存在，请检查文件是否被删除或者没有OBS写入权限。”怎么办？ - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

配置实时网络连接 - 数据治理中心 DataArts Studio

开发批处理单任务SQL作业 - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线