搜索_华为云

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

在“质量作业”页面单击“新建”，进入“基本配置”页面，配置质量作业的基本信息。单击“下一步”进入“规则配置”页面，配置质量作业的相关规则。在“计算范围”的“条件扫描”里面配置数据质量作业参数，如下图所示。图1 设置数据质量参数单击“下一步”，依次配置告警、订阅、调度等信息。配置质量作业的详细操作请参见新建质量作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
新建数据对账作业 - 数据治理中心 DataArts Studio

的版本。计算范围选择扫描区域支持选择“全表扫描”或“条件扫描”，默认为全表扫描。当仅需计算一部分数据，或需周期性按时间戳运行对账作业时，建议通过设置where条件进行条件扫描。 where条件输入where子句，系统会选择符合条件的数据进行扫描。例如需要筛选数据表中“age”字段在

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
开发SQL脚本 - 数据治理中心 DataArts Studio

开发SQL脚本数据开发支持对SQL脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。数据开发模块支持如下类型SQL脚本。而不同数据源的SQL语法有所差异，开发SQL语句前请预先了解各数据源的语法规则。 DLI SQL脚本：请参见SQL语法参考。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 DataArts Studio服务的DLF组件提供了一站式的大数据协同开发平台，借助DLF的在线脚本编辑、周期调度CDM的迁移作业，也可以实现增量数据迁移。这里以DWS导入到OBS为例，介绍DLF配合CDM实现增量迁移的流程：获取CDM作业的JSON

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

云搜索服务（CSS）连接参数说明华为云的云搜索服务（CSS）是一个基于Elasticsearch且完全托管的在线分布式搜索服务，CSS连接适用于将各类日志文件、数据库记录迁移到CSS，Elasticsearch引擎进行搜索和分析的场景。导入数据到CSS推荐使用Logstash

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
配置元数据采集任务 - 数据治理中心 DataArts Studio

单击数据库（或数据库和schema、命名空间）后的“设置”，设置采集任务扫描的数据库（或数据库和schema、命名空间）范围。当不进行设置时，默认选择该数据连接下的所有数据库（或数据库和schema、命名空间）。单击数据表后的“设置”，设置采集任务扫描的数据表范围。当不进行设置时，默认选择数据库（或数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
OCR - 数据治理中心 DataArts Studio

长度为1～128个字符。图片路径是需要识别的图片在OBS上的路径。识别类型是可识别的图片类型, 当前仅支持通用文字识别。可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数是否必选

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
产品功能 - 数据治理中心 DataArts Studio

业务指标监控是对业务指标数据进行质量管理的有效工具，可以灵活的创建业务指标、业务规则和业务场景，实时、周期性进行调度，满足业务的数据质量监控需求。数据质量监控数据质量监控是对数据库里的数据质量进行质量管理的工具，您可以配置数据质量检查规则，在线监控数据准确性。数据质量可以从完整性、

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
SDK概述 - 数据治理中心 DataArts Studio

SDK概述 DataArts Studio服务软件开发工具包（DataArts Studio SDK，DataArts Studio Service Software Development Kit），目前提供了REST API SDK包和数据服务SDK包两种开发包，功能和差异如

 帮助中心 > 数据治理中心 DataArts Studio > SDK参考
数据权限简介 - 数据治理中心 DataArts Studio

控。数据权限模块包含数据目录权限、数据表权限和审批中心三大子模块。具备的功能如下所示：权限自助申请：用户可以选择自己需要权限的数据表，在线上快速发起申请。权限审计：管理员可以快速方便地查看数据库表权限对应人员，进行审计管理。权限回收/交还：管理员可以通过用户权限管理及时回

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 配置数据访问权限
注册API - 数据治理中心 DataArts Studio

Secret）进行安全认证，支持通过SDK或API调用工具调用，安全级别高，推荐使用。 IAM认证：将IAM认证方式的API授权给当前账号或其他账号后，借助从IAM服务获取的用户Token进行安全认证。支持通过API调用工具调用，安全级别中等。无认证：不需要认证，所有用户均可访

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 创建API
获取质量报告子规则字段评分 - 数据治理中心 DataArts Studio

"总行数", "空值率", "告警状态" ], "rows" : [ [ "postgres.public.test.name", "数据表空值扫描", "0.0", "5", "0", "0", "1.0", "false" ] ] } 状态码状态码描述 200 Success 400

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
产品优势 - 数据治理中心 DataArts Studio

型设计，智能化的帮助用户生成数据处理代码，数据处理全流程质量监控，异常事件实时通知。丰富的数据开发类型支持多人在线协作开发，脚本开发可支持SQL、Shell在线编辑、实时查询；作业开发可支持CDM、SQL、MRS、Shell、Spark等多种数据处理节点，提供丰富的调度配置策略与海量的作业调度能力。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
获取质量报告规则评分 - 数据治理中心 DataArts Studio

"1047298515736334336", "scoring_weight" : 5, "rule_type_name" : "数据表空值扫描", "dimension_name" : "完整性", "sub_rule_instance_id" : "1047298617787944960"

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据质量API > 质量报告接口
如何查看表行数和库大小 - 数据治理中心 DataArts Studio

其他参数保持默认即可。规则模板：模板名称：选择“表行数（DWS，HIVE，SparkSQL，ORACLE）”。其他参数保持默认即可。计算范围：选择“全表扫描”。告警条件：非必填，保持默认即可。图3 子作业规则配置单击“下一步”，进入“告警配置”页面。告警条件选择“子规则告警条件”，表达

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

场景下，可以通过建立Hive分区方法减少每一次扫描的总数据量，这种做法可以显著地改善性能。 Hive的分区使用HDFS的子目录功能实现，每一个子目录包含了分区对应的列名和每一列的值。当分区很多时，会有很多HDFS子目录，如果不依赖工具，将外部数据加载到Hive表各分区不是一件容易

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
表达式概述 - 数据治理中心 DataArts Studio

点。数据开发模块EL表达式使用简单的算术和逻辑计算，引用内嵌对象，包括作业对象和一些工具类对象。作业对象：提供了获取作业中上一个节点的输出消息、作业调度计划时间、作业执行时间等属性和方法。工具类对象：提供了一系列字符串、时间、JSON操作方法，例如从一个字符串中截取一个子字符串、时间格式化等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

监控适当调整该值。 hoodie.context.flatmap.parallelism int 1 Hudi在commit时，会进行分区扫描操作，默认是单并发操作，当Hudi单次commit涉及的分区较多时，考虑增大该值以提升commit速度。单次Commit的分区数量 <=

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 100

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据开发调用数据质量算子并且作业运行的时候需要传入质量参数 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

通过数据开发实现数据增量迁移 - 数据治理中心 DataArts Studio

云搜索服务（CSS）连接参数说明 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

OCR - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

SDK概述 - 数据治理中心 DataArts Studio

数据权限简介 - 数据治理中心 DataArts Studio

注册API - 数据治理中心 DataArts Studio

获取质量报告子规则字段评分 - 数据治理中心 DataArts Studio

产品优势 - 数据治理中心 DataArts Studio

获取质量报告规则评分 - 数据治理中心 DataArts Studio

如何查看表行数和库大小 - 数据治理中心 DataArts Studio

MySQL数据迁移到MRS Hive分区表 - 数据治理中心 DataArts Studio

表达式概述 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线