搜索_华为云

新建数据对账作业 - 数据治理中心 DataArts Studio

新建数据对账作业数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。数据质量监控中的对账作业支持跨源数据对账能力，可将创建的规则应用到两张表中进行质量监控，并输出对账结果。创建作业在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
云数据库MySQL/MySQL数据库连接参数说明 - 数据治理中心 DataArts Studio

云数据库MySQL/MySQL数据库连接参数说明连接MySQL数据库连接时，相关参数如表1所示。作业运行中禁止修改密码或者更换用户。在作业运行过程中修改密码或者更换用户，密码不会立即生效且作业会运行失败。表1 MySQL数据库连接参数参数名说明取值样例名称连接的名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
基线运维概述 - 数据治理中心 DataArts Studio

基线运维概述基线运维功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。当前仅北京四、华南广州和上海一局点给用户开放使用。基线运维功能支持用户通过配置基线任务，实现对任务运行状态及资源使用情况的监控；通过配置运维基线，保障复杂依赖场景下重要数据在预期时间内正常产出

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
配置DWS目的端参数 - 数据治理中心 DataArts Studio

配置DWS目的端参数作业中目的连接为DWS连接时，目的端作业参数如表1所示。表1 目的端为DWS时的作业参数参数名说明取值样例模式或表空间待写入数据的数据库名称，支持自动创建Schema。单击输入框后面的按钮可选择模式或表空间。 schema 自动创表只有当源端为关系数据库时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
数据集成API错误码 - 数据治理中心 DataArts Studio

数据集成API错误码调用API出错后，将不会返回结果数据。调用方可根据每个API对应的错误码来定位错误原因。当调用出错时，HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时，可以联系客服，并提供错误码，以便尽快帮您解决问题

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 附录 > 错误码
新建事实表 - 数据治理中心 DataArts Studio

新建事实表归属于某个业务过程的事实逻辑表，可以丰富具体业务过程所对应事务的详细信息。创建事实逻辑表即完成公共的事务明细数据沉淀，从而便于提取业务中事务相关的明细数据。新建事实表并发布在DataArts Studio控制台首页，选择对应工作空间的“数据架构”模块，进入数据架构页面

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤2：数据开发处理本步骤通过BI报表原始数据，分析10大用户关注最多的产品和10大用户评价最差的商品，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。分析10大用户关注最多的产品在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
步骤3：数据开发处理 - 数据治理中心 DataArts Studio

步骤3：数据开发处理本步骤通过电影信息和评分信息的原始数据，分析评分最高的Top10电影和最活跃的Top10电影，然后通过作业定期调度执行并将结果每日导出到表中，以支撑信息分析。创建DWS SQL脚本top_rating_movie（用于存放评分最高的Top10电影）评分最高

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连接主机的用户需要具有主机

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
新建维度 - 数据治理中心 DataArts Studio

新建维度维度建模包含维度、维度表和事实表三个部分。维度是用于观察和分析业务数据的视角，支撑对数据汇聚、钻取、切片分析，用于SQL中的GROUP BY条件。维度多数具有层级结构，如：地理维度（其中包括国家、地区、省以及城市等级别的内容）、时间维度（其中包括年度、季度、月度等级别的内容

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
新建数据质量作业 - 数据治理中心 DataArts Studio

新建数据质量作业质量作业可将创建的规则应用到建好的表中进行质量监控。配置流程在DataArts Studio控制台首页，选择对应工作空间的“数据质量”模块，进入数据质量页面。（可选）选择“数据质量监控 > 质量作业”，新建目录。如果已存在可用的目录，可以不用新建目录。注意，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
源端为HDFS - 数据治理中心 DataArts Studio

源端为HDFS JSON样例 "from-config-values": { "configs": [ { "inputs": [ { "name": "fromJobConfig.inputDirectory

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数表1 HDFS作为源端时的作业参数参数类型参数名说明取值样例基本参数源连接名称由用户下拉选择即可。 hdfs_to_cdm 源目录或文件 “列表文件”选择为“否”时，才有该参数。待迁移数据的目录或单个文件路径。该参数支持配置为时间宏变量，且一个路径名中可以有多个宏定义变量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数作业中源连接为HDFS连接时，即从MRS HDFS、FusionInsight HDFS、Apache HDFS导出数据时，源端作业参数如表1所示。表1 HDFS作为源端时的作业参数参数类型参数名说明取值样例基本参数源连接名称由用户下拉选择即可

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置实时集成作业 - 数据治理中心 DataArts Studio

配置实时集成作业完成数据连接、网络、资源组等准备工作的配置后，您可创建并配置实时集成作业，将多种输入及输出数据源搭配组成同步链路，进行数据的实时同步。前提条件已开通华为账号，并授权使用实时数据集成服务，详情请参考注册华为账号并开通华为云和授权使用实时数据集成。已购买资源组，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
新建数据质量规则 - 数据治理中心 DataArts Studio

新建数据质量规则数据质量支持对离线数据的监控，质量规则是数据质量的核心。DataArts Studio系统内置的模板规则共计34种，分为库级规则、表级规则、字段级规则和跨字段级规则、跨源级规则等规则类型，如表1所示。表1 系统内置的规则模板一览表规则类型维度模板名称适用引擎

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
启用细粒度认证 - 数据治理中心 DataArts Studio

启用细粒度认证在DataArts Studio数据开发组件执行脚本、测试运行作业时，数据源会使用数据连接上的账号进行认证鉴权。因此，即使已通过配置角色/权限集对用户进行权限管控，当用户在数据开发时，权限管控依然无法生效。而在配置细粒度认证后，在DataArts Studio数据开发执行脚本

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
Import GES - 数据治理中心 DataArts Studio

Import GES 功能通过Import GES节点可以将OBS桶中的文件导入到GES的图中。 Import GES算子的具体使用教程，请参见基于MRS Hive表构建图数据并自动导入GES。参数用户可参考表1和表2配置Import GES节点的参数。表1 属性参数参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 1064

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建数据对账作业 - 数据治理中心 DataArts Studio

云数据库MySQL/MySQL数据库连接参数说明 - 数据治理中心 DataArts Studio

基线运维概述 - 数据治理中心 DataArts Studio

配置DWS目的端参数 - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

数据集成API错误码 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

步骤3：数据开发处理 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

新建数据质量作业 - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置HDFS源端参数 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

启用细粒度认证 - 数据治理中心 DataArts Studio

Import GES - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线