搜索_华为云

定义识别规则 - 数据治理中心 DataArts Studio

定义识别规则您可以通过定义敏感数据识别规则，来有效识别数据库内的敏感数据字段。值得注意的是，数据密级、数据分类和识别规则，均为DataArts Studio实例级别配置，各工作空间之间数据互通。这样在数据地图组件中，就可以根据一套标准的分级分类管理对数据进行统一管理。识别规

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
OCR - 数据治理中心 DataArts Studio

OCR 功能 OCR节点支持识别图片上的文字信息, 识别结果将存储到用户指定的OBS目录下。 OCR节点仅支持在华北-北京四使用。参数用户可参考表1和表2配置OCR节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
导入导出 - 数据治理中心 DataArts Studio

导入导出数据架构支持流程、主题、码表、数据标准、关系建模表（物理表）、逻辑实体、维度建模维度/事实表、业务指标、技术指标、数据集市汇总表的导入导出，暂不支持时间限定、审核中心和配置中心数据的导入导出。本例中以导入和导出关系建模表为例说明如何进行导入导出，其他数据操作类似。如果

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
逻辑模型 - 数据治理中心 DataArts Studio

逻辑模型逻辑模型是利用实体及相互之间的关系，准确描述业务规则的实体关系图。逻辑模型要保证业务所需数据结构的正确性及一致性，使用一系列标准的规则将各种对象的特征体现出来，并对各实体之间的关系进行准确定义。同时，逻辑模型也为构建物理模型提供了有力的参考依据，并支持转换为物理模型，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
新建码表 - 数据治理中心 DataArts Studio

新建码表码表，也称lookup表、数据字典表，一般由中英文名称编码组成，由可枚举数据构成，存储枚举数据名称与编码的映射关系。码表的作用主要有：在数据清洗中用于标准化业务数据以及补充映射字段。在质量监控中用于监控业务数据的值域范围。在维度建模中可以引申为枚举维度。新建码表并发布

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 标准设计
开发SQL脚本 - 数据治理中心 DataArts Studio

开发SQL脚本数据开发支持对SQL脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。数据开发模块支持如下类型SQL脚本。而不同数据源的SQL语法有所差异，开发SQL语句前请预先了解各数据源的语法规则。 DLI SQL脚本：请参见SQL语法参考。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
开发Python脚本 - 数据治理中心 DataArts Studio

开发Python脚本数据开发支持对Python脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。 Python脚本开发的样例教程请参见开发一个Python脚本。前提条件已新增Python脚本，请参见新建脚本。已新建主机连接

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
MRS Spark Python - 数据治理中心 DataArts Studio

了资源队列时，此处配置的资源队列为最高优先级。 SQL脚本是仅“脚本类型”配置为“在线脚本”时可以配置。选择已创建的Spark Python脚本。脚本参数否仅“脚本类型”配置为“在线脚本”时可以配置。关联的Spark Python脚本中如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以单击操作列下创建字段转换器。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。在创

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
脚本开发流程 - 数据治理中心 DataArts Studio

脚本开发流程脚本开发功能提供如下能力：提供在线脚本编辑器，支持进行SQL、Shell、Python等脚本在线代码开发和调测。支持导入和导出脚本。支持使用变量和函数。提供编辑锁定能力，支持多人协同开发场景。支持脚本的版本管理能力，支持生成保存版本和提交版本。保存版本时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发
开发Shell脚本 - 数据治理中心 DataArts Studio

开发Shell脚本数据开发支持对Shell脚本进行在线开发、调试和执行，开发完成的脚本可以在作业中调度运行（请参见开发Pipeline作业）。前提条件已新增Shell脚本，请参见新建脚本。已新建主机连接，该Linux主机用于执行Shell脚本，请参见主机连接参数说明。连

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
REST API SDK参考 - 数据治理中心 DataArts Studio

REST API SDK参考本章节介绍了如何在API Explorer通过DataArts Studio API在线生成SDK代码，以及如何获取DataArts Studio服务的REST API SDK包和参考文档。当前DataArts Studio服务的API Explorer接口和REST

帮助中心 > 数据治理中心 DataArts Studio > SDK参考
产品功能 - 数据治理中心 DataArts Studio

支持管理DWS、DLI、MRS Hive等多种数据仓库。支持可视化和DDL方式管理数据库表。脚本开发提供在线脚本编辑器，支持多人协作进行SQL、Shell、Python脚本在线代码开发和调测。支持使用变量。作业开发提供图形化设计器，支持拖拽式工作流开发，快速构建数据处理业务流水线。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
产品优势 - 数据治理中心 DataArts Studio

型设计，智能化的帮助用户生成数据处理代码，数据处理全流程质量监控，异常事件实时通知。丰富的数据开发类型支持多人在线协作开发，脚本开发可支持SQL、Shell在线编辑、实时查询；作业开发可支持CDM、SQL、MRS、Shell、Spark等多种数据处理节点，提供丰富的调度配置策略与海量的作业调度能力。

帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
发现敏感数据 - 数据治理中心 DataArts Studio

发现敏感数据完成了敏感数据识别规则组定义后，就可以根据定义的规则来创建敏感数据识别任务，发现敏感数据，并将敏感数据同步到数据地图组件。敏感数据发现任务运行后，为使该识别规则在静态脱敏任务中生效，必须在“敏感数据分布>手工修正”页面对任务中的识别规则进行“确认”，使规则状态变更为“有效”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接本章节以新建MRS Hive连接为例，介绍如何建立DataArts Studio与数据湖底座之间的数据连接。前提条件在创建数据连接前，请确保您已创建所要连接的数据湖（如DataArts Studio所支持的数据库、云服务等）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 管理中心典型场景教程
管理资产标签 - 数据治理中心 DataArts Studio

管理资产标签标签是用来标识数据的业务含义，是相关性很强的关键字，可以帮助您对资产进行分类和描述，以便于检索。为方便管理技术资产，可以从业务角度定义标签，并与技术资产关联，比如标识某个表是SDI贴源数据层、DWI数据整合层等。标签和分类 “标签”是相关性很强的关键字，帮助用户对资产进行分类和描述，以便于检索。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 查看工作空间数据地图
CSS - 数据治理中心 DataArts Studio

CSS 功能通过CSS节点执行云搜索请求，实现在线分布式搜索功能。参数用户可参考表1和表2配置CSS节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
管理配置中心 - 数据治理中心 DataArts Studio

管理配置中心约束与限制配置中心中各类对象的自定义项配额如下：主题自定义项10条。表自定义项30条。属性自定义项10条。业务指标自定义项50条。主题流程配置主题流程配置用于自定义主题设计中的主题层级和自定义属性。系统默认有三个层级，从上到下分别命名为主题域分组（L1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作

总条数： 134

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

定义识别规则 - 数据治理中心 DataArts Studio

OCR - 数据治理中心 DataArts Studio

导入导出 - 数据治理中心 DataArts Studio

逻辑模型 - 数据治理中心 DataArts Studio

新建码表 - 数据治理中心 DataArts Studio

开发SQL脚本 - 数据治理中心 DataArts Studio

开发Python脚本 - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

字段转换器配置指导 - 数据治理中心 DataArts Studio

脚本开发流程 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

REST API SDK参考 - 数据治理中心 DataArts Studio

产品功能 - 数据治理中心 DataArts Studio

产品优势 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

新建DataArts Studio与MRS Hive数据湖的连接 - 数据治理中心 DataArts Studio

管理资产标签 - 数据治理中心 DataArts Studio

CSS - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线