搜索_华为云

MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
发现敏感数据 - 数据治理中心 DataArts Studio

发现敏感数据完成了敏感数据识别规则组定义后，就可以根据定义的规则来创建敏感数据识别任务，发现敏感数据，并将敏感数据同步到数据地图组件。敏感数据发现任务运行后，为使该识别规则在静态脱敏任务中生效，必须在“敏感数据分布>手工修正”页面对任务中的识别规则进行“确认”，使规则状态变更为“有效”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
DLI Flink Job - 数据治理中心 DataArts Studio

DLI Flink Job 功能 DLI Flink Job节点用于创建和启动作业，或者查询DLI作业是否正在运行，实现实时流式大数据分析。 DLI Flink流式作业提交到DLI之后，若处于运行中的状态，则认为节点执行成功。若作业配置了周期调度，则会周期检查该Flink作业是否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CSS - 数据治理中心 DataArts Studio

CSS 功能通过CSS节点执行云搜索请求，实现在线分布式搜索功能。参数用户可参考表1和表2配置CSS节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
管理配置中心 - 数据治理中心 DataArts Studio

管理配置中心约束与限制配置中心中各类对象的自定义项配额如下：主题自定义项10条。表自定义项30条。属性自定义项10条。业务指标自定义项50条。主题流程配置主题流程配置用于自定义主题设计中的主题层级和自定义属性。系统默认有三个层级，从上到下分别命名为主题域分组（L1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新建一个对账作业实例 - 数据治理中心 DataArts Studio

新建一个对账作业实例场景说明数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章分别以DLI和DWS作为数据源，介绍如何通过DataArts Studio中的数据质量模块实现跨源数据对账的基本一致性校验。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导本指导提供用户端到端的开发一个Flink Jar作业的整体流程，帮助用户快速的创建一个Flink Jar作业并进行调度。参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Stud

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
查看数据质量报告 - 数据治理中心 DataArts Studio

查看数据质量报告您可以查询业务指标、数据质量中数据对象的质量评分，来判断各个对象是否质量达标。质量报告的数据保留最近90天的结果。查看质量报告包含技术报告和业务报告。技术报告的统计范围是依据质量作业的运行结果，包含数据连接、数据库、表名、评分等信息。业务报告的统计范围是

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
配置元数据采集任务 - 数据治理中心 DataArts Studio

配置元数据采集任务本章主要介绍如何通过配置元数据采集策略新建采集任务，不同类型的数据源对应的采集策略不尽相同。元数据管理依据采集任务的配置策略，采集对应的技术元数据信息。约束与限制当元数据采集任务未指定采集范围时，默认采集该数据连接下的所有数据表/文件。采集任务运行完成后，

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 DataArts Studio采用基础包+增量包的计费模式。如果购买的基础包无法满足您的使用需求，您可以额外购买增量包。在购买增量包前，请确保您已购买DataArts Studio实例。增量包大体可分为功能增量包与规格增量包，功能增量包用于拓展DataArts

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
数据治理组织职责 - 数据治理中心 DataArts Studio

数据治理组织职责在战略层面，由数据治理Sponsor和各部门负责人组成的数据治理领导组制定数据治理的战略方向，以构建数据文化和氛围为纲，整体负责数据治理工作的开展、政策的推广和执行，并作为数据治理问题的最终决策组织解决争议，监控和监督数据治理工作的绩效，并确保数据治理工作预算支持。

帮助中心 > 数据治理中心 DataArts Studio > 数据治理方法论 > 数据治理组织架构
批量配置作业 - 数据治理中心 DataArts Studio

批量配置作业参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Studio控制台首页，选择对应工作空间的“数据开发”模块，进入数据开发页面。在数据开发主界面的左侧导航栏，选择“数据开发 > 作业开发”。单击作业目录中的，选择“显示复选框”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 作业开发 > （可选）管理作业
查询作业 - 数据治理中心 DataArts Studio

查询作业功能介绍查询作业接口。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/clusters/{cluster_id}/cdm/job/{job_name} 表1 路径参数参数是否必选参数类型描述 project_id 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM作业配置管理 CDM作业管理界面的“配置管理”页签，主要操作如下：最大抽取并发数定时备份/恢复作业参数的环境变量最大抽取并发数最大抽取并发数即集群最大抽取并发数。此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步，在任意一处修改即可生效。 CD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
配置默认项 - 数据治理中心 DataArts Studio

配置默认项本章节主要介绍默认项的配置。当前只有具备DAYU Administrator或Tenant Administrator账号权限的用户才有默认配置项的相关操作权限。使用场景当某参数被多个作业调用时，可将此参数提取出来作为默认配置项，无需每个作业都配置该参数。表1 配置项列表

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
同Region同租户直接连通网络 - 数据治理中心 DataArts Studio

同Region同租户直接连通网络在配置实时同步任务前，您需要确保源端和目的端的数据库与运行实时同步任务的实时计算资源组之间网络连通，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本章节主要为您介绍数据库部署在华为云，且与Migration资源组同Region同租户场景下的网络打通方案。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 网络打通 > 数据库部署在华为云
MRS Spark - 数据治理中心 DataArts Studio

MRS Spark 功能通过MRS Spark节点实现在MRS中执行预先定义的Spark作业。参数用户可参考表1，表2和表3配置MRS Spark节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 1258

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MRS Spark Python - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

CSS - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

查看数据质量报告 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

数据治理组织职责 - 数据治理中心 DataArts Studio

批量配置作业 - 数据治理中心 DataArts Studio

查询作业 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

配置默认项 - 数据治理中心 DataArts Studio

同Region同租户直接连通网络 - 数据治理中心 DataArts Studio

MRS Spark - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线