搜索_华为云

管理脱敏算法 - 数据治理中心 DataArts Studio

字符替换：支持数值类型和字符类型字符替换，将指定位置的字符替换为固定值或者样本库中样本文件的值；自定义替换位置时支持使用随机数值或随机小写英文字母替换，并支持身份证号末位计算（计算身份证末位时，位数只能选择1，且前面位数需要大于等于17）。新建样本库的请参考管理样本库章节。注意，选择样本库替换时，OBS样本文件只

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 静态脱敏任务
迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

日志信息原因分析这种情况一般是在迁移到DWS时数据有中文，且创建作业时选择了目的端自动建表的情况下。原因是DWS的varchar类型是按字节计算长度，一个中文字符在UTF-8编码下可能要占3个字节。当中文字符的字节超过DWS的varchar的长度时，就会出现错误：value too

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
数据治理度量评分规则 - 数据治理中心 DataArts Studio

数据治理评分卡对各维度度量是按5分制进行评分，每一个度量细项只有得分0或得分1，如果满足度量细项要求得分1，否则得分0。图2 数据治理评分卡数据执行维度度量评分计算范例如上示例，针对流程7.10交付项目管理，数据执行维度有6个度量细项，则这一度量维度的总体得分就是SUM(度量细项得分)*5/6。所以

 帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理度量评估体系
PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
管理权限有效期（高级特性） - 数据治理中心 DataArts Studio

申请短期权限在数据安全页面申请权限或在数据地图页面申请权限时，可以按需选择所申请权限的有效期。选择权限有效期支持选择为固定时长（从申请之日开始计算），也可以自定义配置到期时间（到期时间精确为当天晚上24点）。不配置表示权限不存在超时时间。审批通过后，申请者在有效期内具有所申请的权限。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
授权使用实时数据集成 - 数据治理中心 DataArts Studio

配置DLI云服务跨源场景委托权限。实时数据集成与数据湖探索（DLI）云服务底层使用统一纳管集群资源，首次使用时需要通过DLI云服务创建跨源场景委托，用于底层计算资源访问和使用本租户VPC、子网、路由、对等连接等权限，详细请参见配置DLI云服务委托权限。搜索并进入DLI云服务控制台。在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

帮助您实现数据自由流动。支持自建和云上的文件系统，关系数据库，数据仓库，NoSQL，大数据云服务，对象存储等数据源。数据集成基于分布式计算框架，利用并行化处理技术，支持用户稳定高效地对海量数据进行移动，实现不停服数据迁移，快速构建所需的数据架构。已发布区域：全部数据集成集群管理

 帮助中心 > 数据治理中心 DataArts Studio > 功能总览
数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

在“质量作业”页面单击“新建”，进入“基本配置”页面，配置质量作业的基本信息。单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
基线运维约束限制 - 数据治理中心 DataArts Studio

操作请参见KafkaUI创建Topic。 DLI约束限制： DLI提供的设置作业优先级功能，当资源不充足时，可以优先满足优先级较高的作业的计算资源。DLI优先级功能包含DLI Flink Job、DLI SQL和DLI Spark三个作业算子。只有运行在弹性资源池上的作业支持设置作业优先级。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
元数据简介 - 数据治理中心 DataArts Studio

显示数据库、数据表、数据量的数量及其详情。业务元数据从业务角度描述了数据仓库中的数据，它提供了介于使用者和实际系统之间的语义层，使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。在DataArts Studio中，业务元数据包含业务资产和指标资产，业务资产显示业务对象

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
发现敏感数据 - 数据治理中心 DataArts Studio

CPU核数。您可以根据DLI队列资源合理规划计算资源规格。需要注意的是，Spark任务执行需要driver、executor等多个角色共同调度完成，因此“Executor个数*Executor CPU核数”要小于队列的计算资源CU数，避免其他Spark任务角色无法启动。 Spark作业参数计算公式： CU数=driver

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

debezium.max.queue.size.in.bytes int 0 数据缓存队列大小，默认为0，即表示缓存队列不考虑数据大小，只按照数据条数计算。在debezium.max.queue.size无法有效限制内存占用时，考虑显式设置该值来限制缓存数据的大小。 jdbc.properties

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

该表进行ETL计算时通常会使用时间范围进行裁剪（例如最近一天、一月、一年），这种表通常可以通过数据的创建时间来做分区以保证最佳读写性能。维度表数据量一般整表数据规模较小，以更新数据为主，新增较少，表数据量比较稳定，且读取时通常需要全量读取做join之类的ETL计算，因此通常使用非分区表性能更好。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
新建实时集成作业 - 数据治理中心 DataArts Studio

自定义作业的名称，只能包含英文字母、数字、中划线和下划线。作业类型选择作业的类型，须选择实时处理。离线处理：对已收集的大量数据进行批量处理和分析，这些任务通常是在计算资源和存储资源方面经过优化，以确保高效的数据处理和分析。这些任务通常是定时（例如每天、每周）执行，主要处理大量历史数据，用于批量分析和数据仓库。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

Studio)是数据全生命周期一站式开发运营平台，提供数据集成、数据开发、数据治理、数据服务等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业客户快速构建数据运营能力。产品介绍产品介绍立即使用成长地图由浅入深，带您玩转DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 成长地图
如何选择增量包 - 数据治理中心 DataArts Studio

Studio实例，默认提供了不同的作业节点调度次数/天规格限制。该规格是以每天执行的数据开发作业、质量作业、对账作业、业务场景和元数据采集作业的调度次数之和计算的。其中数据开发作业的每天调度次数，是以节点（包含Dummy节点）为粒度进行度量的，另外补数据任务也会计入度量次数，但测试运行、失败重试不

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
管理维度表 - 数据治理中心 DataArts Studio

”中输入告警条件表达式，然后按照此方法添加其他规则后，单击“确定”。告警条件表达式，由告警参数和逻辑运算符组成。在质量作业运行时，系统将计算出告警条件表达式的结果，并根据表达式的结果是否为真来判断是否触发告警。如果表达式的结果为真则触发质量告警，结果为假则不触发质量告警。在此处

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

rk/spark-examples_2.10/1.1.1/spark-examples_2.10-1.1.1.jar），此Spark作业是计算π的近似值。获取Spark作业代码JAR包后，将JAR包上传到OBS桶中，存储路径为“obs://dlfexample/spark-examples_2

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

当API对应的数据表数据量较大时，获取数据总条数将会比较耗时。此时，如果需要在调用时不计算并返回数据总条数，可以修改use_total_num参数。use_total_num参数用于控制是否计算并返回数据总条数，值为1返回数据总条数，值非1不返回数据总条数。图6 “返回总条数”参数配置

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API

总条数： 153

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理脱敏算法 - 数据治理中心 DataArts Studio

迁移到DWS时出现value too long for type character varying怎么处理？ - 数据治理中心 DataArts Studio

数据治理度量评分规则 - 数据治理中心 DataArts Studio

PostgreSQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

管理权限有效期（高级特性） - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

授权使用实时数据集成 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

基线运维约束限制 - 数据治理中心 DataArts Studio

元数据简介 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

新建实时集成作业 - 数据治理中心 DataArts Studio

数据治理中心 DataArts Studio - 数据治理中心 DataArts Studio

如何选择增量包 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

通过API工具调用无认证方式的API - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线