搜索_华为云

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

在“质量作业”页面单击“新建”，进入“基本配置”页面，配置质量作业的基本信息。单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
数据架构示例 - 数据治理中心 DataArts Studio

捷自助消费。衍生指标：是原子指标通过添加限定、维度卷积而成，限定、维度均来源于原子指标关联表的属性。复合指标：由一个或多个衍生指标叠加计算而成，其中的维度、限定均继承于衍生指标。注意，不能脱离衍生指标、维度和限定的范围，去产生新的维度和限定。数据集市：在DM层新建并发布汇总表。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 使用教程
元数据简介 - 数据治理中心 DataArts Studio

显示数据库、数据表、数据量的数量及其详情。业务元数据从业务角度描述了数据仓库中的数据，它提供了介于使用者和实际系统之间的语义层，使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。在DataArts Studio中，业务元数据包含业务资产和指标资产，业务资产显示业务对象

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

debezium.max.queue.size.in.bytes int 0 数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。 jdbc.properties

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
发现敏感数据 - 数据治理中心 DataArts Studio

CPU核数。您可以根据DLI队列资源合理规划计算资源规格。需要注意的是，Spark任务执行需要driver、executor等多个角色共同调度完成，因此“Executor个数*Executor CPU核数”要小于队列的计算资源CU数，避免其他Spark任务角色无法启动。 Spark作业参数计算公式： CU数=driver

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
如何选择增量包 - 数据治理中心 DataArts Studio

Studio实例，默认提供了不同的作业节点调度次数/天规格限制。该规格是以每天执行的数据开发作业、质量作业、对账作业、业务场景和元数据采集作业的调度次数之和计算的。其中数据开发作业的每天调度次数，是以节点（包含Dummy节点）为粒度进行度量的，另外补数据任务也会计入度量次数，但测试运行、失败重试不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

CDM集群与目标数据源可以正常通信。如果目标数据源为云下的数据库，则需要通过公网或者专线打通网络。通过公网互通时，需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。如果目标数据源为云上服务（如DWS、MRS及ECS等），则网络互通需满足如下条件：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接
管理维度表 - 数据治理中心 DataArts Studio

”中输入告警条件表达式，然后按照此方法添加其他规则后，单击“确定”。告警条件表达式，由告警参数和逻辑运算符组成。在质量作业运行时，系统将计算出告警条件表达式的结果，并根据表达式的结果是否为真来判断是否触发告警。如果表达式的结果为真则触发质量告警，结果为假则不触发质量告警。在此处

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

rk/spark-examples_2.10/1.1.1/spark-examples_2.10-1.1.1.jar），此Spark作业是计算π的近似值。获取Spark作业代码JAR包后，将JAR包上传到OBS桶中，存储路径为“obs://dlfexample/spark-examples_2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

当API对应的数据表数据量较大时，获取数据总条数将会比较耗时。此时，如果需要在调用时不计算并返回数据总条数，可以修改use_total_num参数。use_total_num参数用于控制是否计算并返回数据总条数，值为1返回数据总条数，值非1不返回数据总条数。 https://xx

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

当API对应的数据表数据量较大时，获取数据总条数将会比较耗时。此时，如果需要在调用时不计算并返回数据总条数，可以修改use_total_num参数。use_total_num参数用于控制是否计算并返回数据总条数，值为1返回数据总条数，值非1不返回数据总条数。图6 “返回总条数”参数配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
查询发布包列表 - 数据治理中心 DataArts Studio

array[integer] 发布状态集合。 1：待审批 2：成功 3：失败 5：发布中 sorted_direction 否 String 排序方向，默认是desc。 order_column 否 String 排序字段，默认是apply_timestamp。 limit 否 Integer

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
获取质量作业详情 - 数据治理中心 DataArts Studio

模板参数。 weight Integer 规则权重。 calculation_range String 计算范围。 calculation_range_sql String 计算范围SQL。 alarm_condition String 告警表达式。 export_abnormal_table

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量作业接口
DLI Flink Job - 数据治理中心 DataArts Studio

CUs为DLI计费单位，一个CU是1核4G的资源配置。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。表3 Flink OpenSource

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

查看增量包”，查看已购买的增量包。不同规格类型的资源组，计费不同，详情请查看计费说明，您也可以通过DataArts Studio提供的价格计算器，选择您需要的区域、规格，快速计算出购买DataArts Studio资源组的参考价格。按需计费方式购买数据集成资源组购买“按需计费”增量包，系统会按

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
什么是数据治理中心DataArts Studio - 数据治理中心 DataArts Studio

包含数据集成、数据开发、数据架构、数据质量监控、数据资产管理、数据服务、数据安全等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业快速构建从数据接入到数据分析的端到端智能数据系统，消除数据孤岛，统一数据标准，加快数据变现，实现数字化转型。产品架构如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

SQL脚本，以通过DLI SQL语句来创建数据表。图1 新建脚本在新建脚本弹出的SQL编辑器中输入如下SQL语句，单击“运行”，从OBS原始数据表中计算出10大用户关注最多的产品，将结果存放到top_like_product表。 INSERT OVERWRITE table top_like_product

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

虚拟私有云 DataArts Studio实例中的数据集成CDM集群所属的VPC、子网、安全组。如果DataArts Studio实例或CDM集群需连接云上服务（如DWS、MRS、RDS等），则您需要确保CDM集群与该云服务网络互通。同区域情况下，同虚拟私有云、同子网、同安

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

CDM通过DES（数据快递服务）迁移1个月前的历史数据，迁移路径如下： CDH → DES → CDM（华为云） → OBS → CDM（华为云） → MRS DES适用场景：数据量大，用户私有云与华为云无专线打通，用户私有云网络到公网带宽有限。优点：传输可靠性高，受专线以及网络质量影响较小。缺点：迁移方式耗时较长。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖

总条数： 588

上一页
1
...
4
5
6
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

数据架构示例 - 数据治理中心 DataArts Studio

元数据简介 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

如何选择增量包 - 数据治理中心 DataArts Studio

创建CDM与数据源之间的连接 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

通过浏览器调用无认证方式的API - 数据治理中心 DataArts Studio

通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

查询发布包列表 - 数据治理中心 DataArts Studio

获取质量作业详情 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

购买数据集成资源组增量包 - 数据治理中心 DataArts Studio

什么是数据治理中心DataArts Studio - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

（可选）购买DataArts Studio功能增量包 - 数据治理中心 DataArts Studio

车联网大数搬迁入湖简介场景介绍 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线