搜索_华为云

定义识别规则分组 - 数据治理中心 DataArts Studio

定义敏感数据识别规则组，可以将多个零散的规则组合成为一个有业务逻辑的规则组，该操作是用户后续进行敏感数据发现任务操作的前提。前提条件识别规则创建完成，请参考定义识别规则。约束与限制敏感数据识别过程中，当某个字段同时匹配到识别规则组中的多个识别规则时，此字段密级取多个识别规则的最高密级，字段分类允许有多个。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
查看业务场景实例 - 数据治理中心 DataArts Studio

失败：表示实例运行失败。运行中：表示实例正在运行中。运行结果展示实例运行是否正常结束。正常：表示实例正常结束，且执行结果符合预期。告警：表示实例正常结束，但执行结果不符合预期。异常：表示实例未正常结束。 --：表示实例正在运行中，无执行结果。重跑再次运行业务场景实例。运行日志

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
发现敏感数据 - 数据治理中心 DataArts Studio

认为该字段为敏感字段，并为之匹配相应密级和分类。敏感数据识别过程中，当某个字段同时匹配到识别规则组中的多个识别规则时，此字段密级取多个识别规则的最高密级，字段分类允许有多个。敏感数据识别任务运行后，会为识别到的敏感字段生成相应密级和分类，默认不会生成数据表密级。在手动勾选任务

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全 > 敏感数据治理
执行SQL语句失败，系统提示“Failed to create ThriftService instance, please check the cluster has available resources and check YARN or Spark - 数据治理中心 DataArts Studio

执行SQL语句失败，系统提示“Failed to create ThriftService instance, please check the cluster has available resources and check YARN or Spark driver's logs

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
DIS Stream - 数据治理中心 DataArts Studio

说明节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试是节点执行失败后，是否重新执行节点。是：重新执行节点，请配置以下参数。超时重试最大重试次数重试间隔时间（秒）否：默认值，不重新执行节点。说明：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
主题设计 - 数据治理中心 DataArts Studio

如果当前用户已被添加为审核人，则可以勾选“自助审批”，单击“确认提交”后，主题域分组状态显示为“已发布”。图3 发布主题在一个主题下，还可以新建多个主题。注意，多层主题发布时只能按层级由上至下发布，只有上层主题发布后，下层主题才被允许发布。创建主题时，如果主题创建到业务对象L3层级时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

CONNECT权限的用户(只读用户)创建连接时会出现“表或视图不存在”的提示，需要执行如下操作进行授权：以root用户登录oracle节点。执行如下命令，切换到oracle用户。 su oracle 执行如下命令，登录数据库。 sqlplus /nolog 执行如下命令，登录sys用户 connect sys

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
指定文件名迁移 - 数据治理中心 DataArts Studio

从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（最多50个），文件名之间默认使用“|”

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
新建数据质量规则 - 数据治理中心 DataArts Studio

字段重复值计算数据表中指定字段的重复值行数（当有多个不同的重复值时，以所有重复值个数的和作为该字段的重复值行数）。多字段唯一性校验 HIVE、SparkSQL、DLI、DWS、GBASE、HETUENGINE 校验数据表中多个字段的组合是否唯一，最多支持10个字段的组合。多字段唯一性校验忽略Null

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
指定文件名迁移 - 数据治理中心 DataArts Studio

从FTP/SFTP/OBS导出文件时，CDM支持指定文件名迁移，用户可以单次迁移多个指定的文件（最多50个），导出的多个文件只能写到目的端的同一个目录。在创建表/文件迁移作业时，如果源端数据源为FTP/SFTP/OBS，CDM源端的作业参数“源目录或文件”支持输入多个文件名（最多50个），文件名之间默认使用“|”

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

到如下痛点：作业失败无感知：大数据的离线作业大部分会在凌晨执行，当作业失败时，用户无法及时得知并处理。作业补数窗口期较短：上游作业失败重跑过多导致下游核心业务执行时间超过基线，导致影响业务时发现时间太晚，无法及时执行补救措施。为了解决这些痛点，您可以通过配置各类作业告警，及

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
业务指标监控简介 - 数据治理中心 DataArts Studio

标是否满足质量规则。业务场景的运行结果说明如下：正常：表示实例正常结束，且执行结果符合预期。告警：表示实例正常结束，但执行结果不符合预期。异常：表示实例未正常结束。 --：表示实例正在运行中，无执行结果。业务指标监控主界面包括以下功能模块。功能说明总览默认首页是总

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 业务指标监控（待下线）
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

GB规格集群的最大抽取并发数上限为16。 1 加载（写入）并发数加载（写入）时并发执行的Loader数量。仅当HBase或Hive作为目的数据源时该参数才显示。 3 分片重试次数每个分片执行失败时的重试次数，为0表示不重试。 0 是否写入脏数据选择是否记录脏数据，默认不记录脏数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
数据集成应用示例 - 数据治理中心 DataArts Studio

分割为多个任务并发执行。导入DWS的数据库名称为public，表名为cdm_all_type，导入前不清空数据。当DWS数据库里没有本地MySQL数据库中的表时，CDM自动在DWS端创建该表。 DWS端加载的字段列表为id&gid&name。作业抽取数据时，并发执行的Extractor数量为3。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 应用示例
开发Shell脚本 - 数据治理中心 DataArts Studio

在编辑器上方，单击“运行”。Shell语句运行完成后，在编辑器下方可以查看脚本的执行历史和执行结果。对于执行结果支持如下操作：重命名：可通过双击执行结果页签的名称进行重命名，也可通过右键单击执行结果页签的名称，单击重命名。重命名不能超过16个字符。可通过右键单击执行结果页签的名称关闭当前页签、关闭左侧页签、关

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
配置离线处理集成作业 - 数据治理中心 DataArts Studio

Studio数据连接创建所需连接。需要测试数据源端和资源组之间网络是否可用，不可用时根据界面提示修改。选择资源组，集群创建可参见创建CDM集群。选多个集群时系统会随机下发任务，故需要多个集群时版本规格建议选择集群版本一致的集群，否则可能因为集群版本不一致导致作业失败。选择已创建的目的端数据连接，且创建的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
基本概念 - 数据治理中心 DataArts Studio

合理而无法写入的数据。作业（数据开发）在数据开发中，作业由一个或多个节点组成，共同执行以完成对数据的一系列操作。节点节点用于定义对数据执行的操作。例如，使用“MRS Spark”节点可以实现在MRS中执行预先定义的Spark作业。解决方案解决方案定位于为用户提供便捷的

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
Python - 数据治理中心 DataArts Studio

设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。失败重试是节点执行失败后，是否重新执行节点。是：重新执行节点，请配置以下参数。超时重试最大重试次数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
发布任务包 - 数据治理中心 DataArts Studio

发布任务包功能介绍目前支持发布包管理中相关包的发布，支持发布多个任务包。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。 URI URI格式 POST /v2/{project_id}/factory/release-packages/deploy 参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V2） > 作业开发API
配置实时集成作业 - 数据治理中心 DataArts Studio

支持将源端一个实例下的单张表实时同步至目的端一个实例下的单张表。整库支持将源端一个实例下多个库的多张表批量实时同步到目的端一个实例下的多个库表，一个任务中最多支持200张目标表。分库分表支持将源端多个实例下多个分库的多张分表同步到目的端一个实例下的单个库表。图2 选择集成作业类型配置网络资源。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）

总条数： 720

上一页
1
...
4
5
6
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

定义识别规则分组 - 数据治理中心 DataArts Studio

查看业务场景实例 - 数据治理中心 DataArts Studio

发现敏感数据 - 数据治理中心 DataArts Studio

执行SQL语句失败，系统提示“Failed to create ThriftService instance, please check the cluster has available resources and check YARN or Spark - 数据治理中心 DataArts Studio

DIS Stream - 数据治理中心 DataArts Studio

主题设计 - 数据治理中心 DataArts Studio

ORACLE数据连接参数说明 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

指定文件名迁移 - 数据治理中心 DataArts Studio

DataArts Studio数据开发作业告警最佳实践 - 数据治理中心 DataArts Studio

业务指标监控简介 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

数据集成应用示例 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

发布任务包 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线