搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
目的端为OBS - 数据治理中心 DataArts Studio

目的端为OBS JSON样例 "to-config-values": { "configs": [ { "inputs": [ { "name": "toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
GaussDB集中式/分布式同步到DWS作业配置 - 数据治理中心 DataArts Studio

GaussDB集中式/分布式同步到DWS作业配置 GaussDB即GaussDB集中式/分布式数据库，本章节以GaussDB为例。支持的源端和目的端数据库版本表1 支持的数据库版本源端数据库目的端数据库 GaussDB集中式/分布式数据库（内核引擎版本505.1.0、505

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
新建数据对账作业 - 数据治理中心 DataArts Studio

新建数据对账作业数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。数据质量监控中的对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。创建作业在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
创建数据脱敏策略 - 数据治理中心 DataArts Studio

创建数据脱敏策略功能介绍创建动态数据脱敏策略。调用方法请参见如何调用API。 URI POST /v1/{project_id}/security/masking/dynamic/policies 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 动态数据脱敏接口
新建事实表 - 数据治理中心 DataArts Studio

新建事实表归属于某个业务过程的事实逻辑表，可以丰富具体业务过程所对应事务的详细信息。创建事实逻辑表即完成公共的事务明细数据沉淀，从而便于提取业务中事务相关的明细数据。新建事实表并发布在DataArts Studio控制台首页，选择对应工作空间的“数据架构”模块，进入数据架构页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
数据集成API错误码 - 数据治理中心 DataArts Studio

数据集成API错误码调用API出错后，将不会返回结果数据。调用方可根据每个API对应的错误码来定位错误原因。当调用出错时，HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系客服，并提供错误码，以便尽快帮您解决问题。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

步骤3：数据开发处理本步骤通过电影信息和评分信息的原始数据，分析评分最高的Top10电影和最活跃的Top10电影，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。创建DWS SQL脚本top_rating_movie（用于存放评分最高的Top10电影）评分最

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
源端为HDFS - 数据治理中心 DataArts Studio

源端为HDFS JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
更新业务指标 - 数据治理中心 DataArts Studio

更新业务指标功能介绍更新业务指标。调用方法请参见如何调用API。 URI PUT /v2/{project_id}/design/biz-metrics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
创建业务指标 - 数据治理中心 DataArts Studio

创建业务指标功能介绍创建业务指标。调用方法请参见如何调用API。 URI POST /v2/{project_id}/design/biz-metrics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置功能介绍更新表的异常数据输出配置，包括是否生成异常数据、设置异常数据数据库或Schema、设置异常表表前缀/表后缀。调用方法请参见如何调用API。 URI PUT /v2/{project_id}/design/{table_id}/qualities

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 质量规则接口
配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数作业中源连接为HDFS连接时，即从MRS HDFS、FusionInsight HDFS、Apache HDFS导出数据时，源端作业参数如表1所示。表1 HDFS作为源端时的作业参数参数类型参数名说明取值样例基本参数源连接名称由用户下拉选择即可。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
新建数据质量作业 - 数据治理中心 DataArts Studio

新建数据质量作业质量作业可将创建的规则应用到建好的表中进行质量监控。配置流程在DataArts Studio控制台首页，选择对应工作空间的“数据质量”模块，进入数据质量页面。（可选）选择“数据质量监控 > 质量作业”，新建目录。如果已存在可用的目录，可以不用新建目录。注意

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
更新动态数据脱敏策略 - 数据治理中心 DataArts Studio

更新动态数据脱敏策略功能介绍更新动态数据脱敏策略。调用方法请参见如何调用API。 URI PUT /v1/{project_id}/security/masking/dynamic/policies/{id} 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 动态数据脱敏接口
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）

总条数： 889

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

GaussDB集中式/分布式同步到DWS作业配置 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

创建数据脱敏策略 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

更新业务指标 - 数据治理中心 DataArts Studio

创建业务指标 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

更新动态数据脱敏策略 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线