搜索_华为云

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

debezium.max.queue.size.in.bytes int 0 数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。 jdbc.properties

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

Studio)是数据全生命周期一站式开发运营平台，提供数据集成、数据开发、数据治理、数据服务等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业客户快速构建数据运营能力。产品介绍产品介绍立即使用成长地图由浅入深，带您玩转DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 成长地图
产品优势 - 数据治理中心 DataArts Studio

型设计，智能化的帮助用户生成数据处理代码，数据处理全流程质量监控，异常事件实时通知。丰富的数据开发类型支持多人在线协作开发，脚本开发可支持SQL、Shell在线编辑、实时查询；作业开发可支持CDM、SQL、MRS、Shell、Spark等多种数据处理节点，提供丰富的调度配置策略与海量的作业调度能力。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

在“质量作业”页面单击“新建”，进入“基本配置”页面，配置质量作业的基本信息。单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
新建实时集成作业 - 数据治理中心 DataArts Studio

自定义作业的名称，只能包含英文字母、数字、中划线和下划线。作业类型选择作业的类型，须选择实时处理。离线处理：对已收集的大量数据进行批量处理和分析，这些任务通常是在计算资源和存储资源方面经过优化，以确保高效的数据处理和分析。这些任务通常是定时（例如每天、每周）执行，主要处理大量历史数据，用于批量分析和数据仓库。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
基线运维约束限制 - 数据治理中心 DataArts Studio

操作请参见KafkaUI创建Topic。 DLI约束限制： DLI提供的设置作业优先级功能，当资源不充足时，可以优先满足优先级较高的作业的计算资源。DLI优先级功能包含DLI Flink Job、DLI SQL和DLI Spark三个作业算子。只有运行在弹性资源池上的作业支持设置作业优先级。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
元数据简介 - 数据治理中心 DataArts Studio

显示数据库、数据表、数据量的数量及其详情。业务元数据从业务角度描述了数据仓库中的数据，它提供了介于使用者和实际系统之间的语义层，使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。在DataArts Studio中，业务元数据包含业务资产和指标资产，业务资产显示业务对象

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
如何选择增量包 - 数据治理中心 DataArts Studio

Studio实例，默认提供了不同的作业节点调度次数/天规格限制。该规格是以每天执行的数据开发作业、质量作业、对账作业、业务场景和元数据采集作业的调度次数之和计算的。其中数据开发作业的每天调度次数，是以节点（包含Dummy节点）为粒度进行度量的，另外补数据任务也会计入度量次数，但测试运行、失败重试不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
发现敏感数据 - 数据治理中心 DataArts Studio

CPU核数。您可以根据DLI队列资源合理规划计算资源规格。需要注意的是，Spark任务执行需要driver、executor等多个角色共同调度完成，因此“Executor个数*Executor CPU核数”要小于队列的计算资源CU数，避免其他Spark任务角色无法启动。 Spark作业参数计算公式： CU数=driver

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
管理维度表 - 数据治理中心 DataArts Studio

”中输入告警条件表达式，然后按照此方法添加其他规则后，单击“确定”。告警条件表达式，由告警参数和逻辑运算符组成。在质量作业运行时，系统将计算出告警条件表达式的结果，并根据表达式的结果是否为真来判断是否触发告警。如果表达式的结果为真则触发质量告警，结果为假则不触发质量告警。在此处

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
与其他云服务的关系 - 数据治理中心 DataArts Studio

与其他云服务的关系统一身份认证服务 DataArts Studio使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证和鉴权功能。云审计服务 DataArts Studio使用云审计服务（Cloud Trace Servic

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
步骤2：数据开发处理 - 数据治理中心 DataArts Studio

SQL脚本，以通过DLI SQL语句来创建数据表。图1 新建脚本在新建脚本弹出的SQL编辑器中输入如下SQL语句，单击“运行”，从OBS原始数据表中计算出10大用户关注最多的产品，将结果存放到top_like_product表。 INSERT OVERWRITE table top_like_product

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

当API对应的数据表数据量较大时，获取数据总条数将会比较耗时。此时，如果需要在调用时不计算并返回数据总条数，可以修改use_total_num参数。use_total_num参数用于控制是否计算并返回数据总条数，值为1返回数据总条数，值非1不返回数据总条数。图6 “返回总条数”参数配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

rk/spark-examples_2.10/1.1.1/spark-examples_2.10-1.1.1.jar），此Spark作业是计算π的近似值。获取Spark作业代码JAR包后，将JAR包上传到OBS桶中，存储路径为“obs://dlfexample/spark-examples_2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
获取质量作业详情 - 数据治理中心 DataArts Studio

模板参数。 weight Integer 规则权重。 calculation_range String 计算范围。 calculation_range_sql String 计算范围SQL。 alarm_condition String 告警表达式。 export_abnormal_table

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量作业接口
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接本章节以新建MRS Hive连接为例，介绍如何建立DataArts Studio与数据湖底座之间的数据连接。前提条件在创建数据连接前，请确保您已创建所要连接的数据湖（如DataArts Studio所支持的数据库、云服务等）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
DLI Flink Job - 数据治理中心 DataArts Studio

CUs为DLI计费单位，一个CU是1核4G的资源配置。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。表3 Flink OpenSource

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据集成概述 - 数据治理中心 DataArts Studio

登录DataArts Studio控制台。选择对应工作空间的“数据集成”模块，进入CDM主界面。云数据迁移简介云数据迁移基于分布式计算框架，利用并行化处理技术，支持用户稳定高效地对海量数据进行移动，实现不停服数据迁移，快速构建所需的数据架构。图1 数据集成定位产品功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
认证鉴权 - 数据治理中心 DataArts Studio

避免频繁调用。使用Token前请确保Token离过期有足够的时间，防止调用API的过程中Token过期导致调用API失败。 Token在计算机系统中代表令牌（临时）的意思，拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头，从而通过身份认证，获得操作API的权限。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 如何调用API

总条数： 354

上一页
1
...
4
5
6
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

产品优势 - 数据治理中心 DataArts Studio

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

基线运维约束限制 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

元数据简介 - 数据治理中心 DataArts Studio

如何选择增量包 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

与其他云服务的关系 - 数据治理中心 DataArts Studio

步骤2：数据开发处理 - 数据治理中心 DataArts Studio

通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

获取质量作业详情 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

数据集成概述 - 数据治理中心 DataArts Studio

认证鉴权 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线