搜索_华为云

补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍适用场景在某项目搬迁场景下，当您需要补充以前时间段内的历史业务数据，需要查看历史数据的详细信息时，可以使用补数据特性。补数据是指作业执行一个调度任务，在过去某一段时间里生成一系列的实例。用户可以通过补数据，修正历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
配置环境变量 - 数据治理中心 DataArts Studio

配置环境变量本章节主要介绍环境变量的配置和使用。使用场景配置作业参数，当某参数隶属于多个作业，可将此参数提取出来作为环境变量，环境变量支持导入和导出。简单模式和企业模式下，配置工作空间的环境变量的角色有所不同：简单模式：工作空间的环境变量开发者和管理员都能创建或编辑环境

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
步骤1：流程设计 - 数据治理中心 DataArts Studio

步骤1：流程设计本入门指南以某市出租车出行数据为例，统计某出租车供应商2017年度的运营数据。基于需求分析和业务调研，数据治理业务流程设计如图1所示，后续的数据治理操作均基于本业务流程完成。图1 流程设计需求分析通过需求分析，可以提炼出数据治理流程的实现框架，支撑具体数据治理实施流程的设计。

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
嵌入数据水印 - 数据治理中心 DataArts Studio

嵌入数据水印本章主要介绍如何进行数据水印嵌入。数据水印一般有如下场景：规范数据外发流程实现对企业内部人员数据外发进行有效流程化管理，非授权用户在数据外发前需审批，审批通过后采取数据水印技术生成可外发数据文件。数据版权保护通过在关系数据库中嵌入代表所有权的水印信息，可以将

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据保护 > 管理数据水印
补数据场景使用介绍 - 数据治理中心 DataArts Studio

补数据场景使用介绍适用场景在某项目搬迁场景下，当您需要补充以前时间段内的历史业务数据，需要查看历史数据的详细信息时，可以使用补数据特性。补数据是指作业执行一个调度任务，在过去某一段时间里生成一系列的实例。用户可以通过补数据，修正历史中出现数据错误的作业实例，或者构建更多的作业记录以便调试程序等。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
删除集群 - 数据治理中心 DataArts Studio

删除集群功能介绍删除集群接口。调用方法请参见如何调用API。 URI DELETE /v1.1/{project_id}/clusters/{cluster_id} 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
启动集群 - 数据治理中心 DataArts Studio

启动集群功能介绍启动集群接口。调用方法请参见如何调用API。 URI POST /v1.1/{project_id}/clusters/{cluster_id}/action 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目ID，获取方法请参见项目ID和账号ID。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 集群管理
同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

同步MRS Hive和Hetu权限在MRS Hetu对接MRS hive数据源并使用Ranger权限管控的场景下，通过Hetu访问同集群的Hive数据源，会统一使用Hetu端的Ranger权限做鉴权，而不受Hive端的Ranger权限管控。为了避免该场景下需要在Hetu端重复

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 统一权限治理 > 数据权限访问控制
通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业如果CDM作业接收来自数据开发作业配置的参数，则在数据开发模块可以使用诸如EL表达式传递动态参数来调度CDM作业。本示例介绍的参数传递功能仅支持CDM 2.8.6版本及以上集群。本示例以执行迁移Oracle数据到MRS Hive的C

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
添加审核人 - 数据治理中心 DataArts Studio

添加审核人在数据架构中，业务流程中的步骤都需要经过审批，因此，需要先添加审核人。只有工作空间管理员角色的用户才具有添加审核人的权限。添加审核人审核人必须是当前工作空间下具有审核权限的成员，需要先在“DataArts Studio首页-空间管理”的工作空间内编辑并添加空间成员。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
DLI Spark - 数据治理中心 DataArts Studio

DLI Spark 功能通过DLI Spark节点执行一个预先定义的Spark作业。 DLI Spark节点的具体使用教程，请参见开发一个DLI Spark作业。参数用户可参考表1，表2和表3配置DLI Spark节点的参数。表1 属性参数参数是否必选说明节点名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
MRS Spark Python - 数据治理中心 DataArts Studio

MRS Spark Python 功能通过MRS Spark Python节点实现在MRS中执行预先定义的Spark Python作业。 MRS Spark Python算子的具体使用教程，请参见开发一个MRS Spark Python作业。参数用户可参考表1，表2和表3配置MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
启动作业 - 数据治理中心 DataArts Studio

启动作业功能介绍启动作业接口。调用方法请参见如何调用API。 URI PUT /v1.1/{project_id}/clusters/{cluster_id}/cdm/job/{job_name}/start 表1 路径参数参数是否必选参数类型描述 project_id

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 作业管理
发现敏感数据 - 数据治理中心 DataArts Studio

发现敏感数据完成了敏感数据识别规则组定义后，就可以根据定义的规则来创建敏感数据识别任务，发现敏感数据，并将敏感数据同步到数据地图组件。敏感数据发现任务运行后，为使该识别规则在静态脱敏任务中生效，必须在“敏感数据分布>手工修正”页面对任务中的识别规则进行“确认”，使规则状态变更为“有效”。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
DLI Flink Job - 数据治理中心 DataArts Studio

DLI Flink Job 功能 DLI Flink Job节点用于创建和启动作业，或者查询DLI作业是否正在运行，实现实时流式大数据分析。 DLI Flink流式作业提交到DLI之后，若处于运行中的状态，则认为节点执行成功。若作业配置了周期调度，则会周期检查该Flink作业是否

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CSS - 数据治理中心 DataArts Studio

CSS 功能通过CSS节点执行云搜索请求，实现在线分布式搜索功能。参数用户可参考表1和表2配置CSS节点的参数。表1 属性参数参数是否必选说明节点名称是节点名称，可以包含中文、英文字母、数字、“_”、“-”、“/”、“<”、“>”等各类特殊字符，长度为1～128个字符。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
管理配置中心 - 数据治理中心 DataArts Studio

管理配置中心约束与限制配置中心中各类对象的自定义项配额如下：主题自定义项10条。表自定义项30条。属性自定义项10条。业务指标自定义项50条。主题流程配置主题流程配置用于自定义主题设计中的主题层级和自定义属性。系统默认有三个层级，从上到下分别命名为主题域分组（L1

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
新建一个对账作业实例 - 数据治理中心 DataArts Studio

新建一个对账作业实例场景说明数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章分别以DLI和DWS作为数据源，介绍如何通过DataArts Studio中的数据质量模块实现跨源数据对账的基本一致性校验。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成 > 关键操作指导
新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导操作场景作业参数配置完成后，将进行字段映射的配置，您可以通过字段映射界面的可自定义新增字段。如果是文件类数据源（FTP/SFTP/HDFS/OBS）之间相互迁移数据，且源端“文件格式”配置为“二进制格式”（即不解析文件内容直接传输），则没有字段映射这一步骤。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 离线处理集成作业开发

总条数： 1205

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

补数据场景使用介绍 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

步骤1：流程设计 - 数据治理中心 DataArts Studio

嵌入数据水印 - 数据治理中心 DataArts Studio

补数据场景使用介绍 - 数据治理中心 DataArts Studio

删除集群 - 数据治理中心 DataArts Studio

启动集群 - 数据治理中心 DataArts Studio

同步MRS Hive和Hetu权限 - 数据治理中心 DataArts Studio

通过数据开发使用参数传递灵活调度CDM作业 - 数据治理中心 DataArts Studio

添加审核人 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

MRS Spark Python - 数据治理中心 DataArts Studio

启动作业 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

CSS - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

新增字段操作指导 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线