搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置DWS目的端参数 - 数据治理中心 DataArts Studio

配置DWS目的端参数作业中目的连接为DWS连接时，目的端作业参数如表1所示。表1 目的端为DWS时的作业参数参数名说明取值样例模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 自动创表只有当源端为

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
新建事实表 - 数据治理中心 DataArts Studio

新建事实表归属于某个业务过程的事实逻辑表，可以丰富具体业务过程所对应事务的详细信息。创建事实逻辑表即完成公共的事务明细数据沉淀，从而便于提取业务中事务相关的明细数据。新建事实表并发布在DataArts Studio控制台首页，选择对应工作空间的“数据架构”模块，进入数据架构页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
创建数据脱敏策略 - 数据治理中心 DataArts Studio

创建数据脱敏策略功能介绍创建动态数据脱敏策略。调用方法请参见如何调用API。 URI POST /v1/{project_id}/security/masking/dynamic/policies 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 动态数据脱敏接口
数据集成API错误码 - 数据治理中心 DataArts Studio

数据集成API错误码调用API出错后，将不会返回结果数据。调用方可根据每个API对应的错误码来定位错误原因。当调用出错时，HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系客服，并提供错误码，以便尽快帮您解决问题。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
更新业务指标 - 数据治理中心 DataArts Studio

更新业务指标功能介绍更新业务指标。调用方法请参见如何调用API。 URI PUT /v2/{project_id}/design/biz-metrics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
创建业务指标 - 数据治理中心 DataArts Studio

创建业务指标功能介绍创建业务指标。调用方法请参见如何调用API。 URI POST /v2/{project_id}/design/biz-metrics 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 业务指标接口
源端为HDFS - 数据治理中心 DataArts Studio

源端为HDFS JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
新建维度 - 数据治理中心 DataArts Studio

新建维度维度建模包含维度、维度表和事实表三个部分。维度是用于观察和分析业务数据的视角，支撑对数据汇聚、钻取、切片分析，用于SQL中的GROUP BY条件。维度多数具有层级结构，如：地理维度（其中包括国家、地区、省以及城市等级别的内容）、时间维度（其中包括年度、季度、月度等级别的内容）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置功能介绍更新表的异常数据输出配置，包括是否生成异常数据、设置异常数据数据库或Schema、设置异常表表前缀/表后缀。调用方法请参见如何调用API。 URI PUT /v2/{project_id}/design/{table_id}/qualities

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据架构API > 质量规则接口
配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数作业中源连接为HDFS连接时，即从MRS HDFS、FusionInsight HDFS、Apache HDFS导出数据时，源端作业参数如表1所示。表1 HDFS作为源端时的作业参数参数类型参数名说明取值样例基本参数源连接名称由用户下拉选择即可。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，详情请参见购买数据集成资源组。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
新建数据质量作业 - 数据治理中心 DataArts Studio

新建数据质量作业质量作业可将创建的规则应用到建好的表中进行质量监控。配置流程在DataArts Studio控制台首页，选择对应工作空间的“数据质量”模块，进入数据质量页面。（可选）选择“数据质量监控 > 质量作业”，新建目录。如果已存在可用的目录，可以不用新建目录。注意

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置离线处理集成作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业数据集成支持创建离线作业，通过在界面勾选源端数据和目的端数据，并结合为其配置的参数，实现将源端单表、分库分表、整库的全量或增量数据周期性同步至目标数据表。本文为您介绍离线同步任务的常规配置，各数据源配置存在一定差异，请以配置作业源端参数及配置作业目的端参数为准。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
更新动态数据脱敏策略 - 数据治理中心 DataArts Studio

更新动态数据脱敏策略功能介绍更新动态数据脱敏策略。调用方法请参见如何调用API。 URI PUT /v1/{project_id}/security/masking/dynamic/policies/{id} 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 动态数据脱敏接口
Import GES - 数据治理中心 DataArts Studio

Import GES 功能通过Import GES节点可以将OBS桶中的文件导入到GES的图中。 Import GES算子的具体使用教程，请参见基于MRS Hive表构建图数据并自动导入GES。参数用户可参考表1和表2配置Import GES节点的参数。表1 属性参数参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数表1 HDFS作为源端时的作业参数参数类型参数名说明取值样例基本参数源连接名称由用户下拉选择即可。 hdfs_to_cdm 源目录或文件 “列表文件”选择为“否”时，才有该参数。待迁移数据的目录或单个文件路径。该参数支持配置为时间宏变量，且

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数

总条数： 888

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

配置DWS目的端参数 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

创建数据脱敏策略 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

更新业务指标 - 数据治理中心 DataArts Studio

创建业务指标 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

更新表的异常数据输出配置 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

更新动态数据脱敏策略 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线