搜索_华为云

查看数据血缘 - 数据治理中心 DataArts Studio

化查看数据血缘关系。约束限制数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。对于同一版本的数据开发作业，系统基于最新的作业调度实例生成数据血缘关系后，在冷却期（默认为48小时）内不会再次更新数据血缘关系。如需更新，需要等待冷却期结束或将数据开发作业再次提交版本后调度。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
逻辑模型 - 数据治理中心 DataArts Studio

下载关系建模导入模板后，编辑完成后保存至本地。选择是否更新已有数据。如果系统中已有的编码和模板中的编码相同，系统则认为是数据重复。不更新：当数据重复时，不会替换系统中原有的数据。更新：当数据重复时系统中的原有数据为草稿状态，则会覆盖生成新的草稿数据。系统中的原有数据为发布状态，则会生成下展数据。单

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 数据调研
DataArts Studio和ROMA有什么差异？ - 数据治理中心 DataArts Studio

从数据运营方案（数据中台）的数据集成、数据治理以及数据开放三层结构来看，DataArts Studio和ROMA主要差别在于数据治理方面： ROMA作为连接各个系统的管道，对接入数据没有治理和规划的功能。 DataArts Studio支持对接入数据进行结构分析，重新建模，最终打破数据孤岛，帮助企业建立统一数据模型。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 咨询与计费
源端为对象存储 - 数据治理中心 DataArts Studio

BINARY_FILE：二进制格式，不解析文件内容直接传输，不要求文件格式必须为二进制。适用于文件到文件的原样复制。当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.lineSeparator 否 String 文件中的换行符，默认自动识别"\\n"、"\\r"或"\\r

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
Python - 数据治理中心 DataArts Studio

hon脚本，系统自动默认显示Python版本，例如Python3。如果脚本未创建，请参考新建脚本和开发Python脚本先创建和开发脚本。说明：若选择Python语句方式，数据开发模块将无法解析您输入Python语句中携带的参数。若选择Python脚本方式，系统自动默认显示的

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
配置OBS桶 - 数据治理中心 DataArts Studio

未配置测试运行历史OBS桶，则无法查看历史运行的详细信息。请参考本节操作配置OBS桶。约束限制 OBS路径仅支持OBS桶，不支持并行文件系统。配置方法参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts Stu

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
业务指标 - 数据治理中心 DataArts Studio

在弹出框中，选择审核人，单击“确认提交”，提交审核。如果当前用户已被添加为审核人，则可以勾选“自助审批”，单击“确认提交”后，状态显示为“已发布”。选择审核人时，系统支持选择多个审核人，全部审批通过后，状态才会显示为已发布。如果有任意一个人驳回，则状态为已驳回。可以参照步骤3~步骤5，完成其他业务指标的创建和发布。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计
IF条件判断教程 - 数据治理中心 DataArts Studio

Studio实例，单击实例卡片上的“进入控制台”，进入概览页面。选择“空间管理”页签，在工作空间列表中，找到所需要的工作空间，单击工作空间的“数据开发”，系统跳转至数据开发页面。在“作业开发”页面，新建数据开发作业，然后分别选择CDM节点和两个Dummy节点，选中连线图标并拖动，编排图1所示的作业。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

il01、mail02和mail03，且表结构一致，数据内容不同。目的端为MRS Hive服务。操作前提已创建CDM集群。已经开通了MRS Hive服务。已经在MRS Hive服务中创建了数据库和表。创建连接登录DataArts Studio控制台，找到所需要的DataArts

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践
数据血缘方案简介 - 数据治理中心 DataArts Studio

方式。一般推荐使用自动血缘解析的方式，无需手动配置即可生成血缘关系，在不支持自动血缘解析的场景下，再手动配置血缘关系。自动血缘解析，是由系统解析数据开发作业中的数据处理和数据迁移类型节点后自动产生的，无需进行手动配置。支持自动血缘解析的节点类型和场景请参见自动血缘解析。手动配

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
MRS Spark - 数据治理中心 DataArts Studio

您需要先在数据安全服务队列权限功能中，配置对应的队列后，才能在此处选择到已配置的队列。当有多处同时配置了资源队列时，此处配置的资源队列为最高优先级。 Spark作业名称是 MRS作业名称，只能由英文字母、数字、中划线和下划线组成，长度不能超过64个字符。系统支持作业名称按照作业名称_节点名称格式自动填入。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
执行SQL语句失败，系统提示“Failed to create ThriftService instance, please check the cluster has available resources and check YARN or Spark - 数据治理中心 DataArts Studio

or Spark driver's logs for further information”。可能原因由于MRS服务的AM资源不足导致。解决方案登录MRS服务的管理面。进入FusionInsight Manager后，选择“租户资源”页签。单击左侧“动态资源计划”进入动态资源计划页面。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据开发
关系建模 - 数据治理中心 DataArts Studio

导入物理模型时，如果数据源类型不支持，系统会默认继承物理模型的数据连接类型。在物理表列表中，单击列表上方的“导入”，选择“导入PDM”。在“导入表”对话框中，选择“导入配置”页签。图12 导入PDM 选择是否更新已有数据。不更新：当数据重复时，不会替换系统中原有的数据。更新：当数据重复时系统中的原有

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计
逆向数据库（关系建模） - 数据治理中心 DataArts Studio

下拉选择Schema。该参数仅DWS和POSTGRESQL模型的表有效。更新已有表在导入时，如果所要导入的表在关系模型中已存在，是否更新已有的表。在导入时，系统将按表编码进行判断将要导入的表在当前的关系模型中是否已存在。在导入时，只有创建或更新操作，不会删除已有的表。不更新：如果表已存在，将直接跳过，不更新。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
CDM Job - 数据治理中心 DataArts Studio

Job节点执行一个预先定义的CDM作业，实现数据迁移功能。如果CDM作业中配置了时间宏变量，通过DataArts Studio数据开发调度CDM迁移作业时，系统会将时间宏变量替换为（数据开发作业计划启动时间-偏移量），而不是（CDM作业实际启动时间-偏移量）。参数用户可参考表1，表2和表3配置CDM

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

发作业中要包含支持自动血缘解析的节点类型和场景，或者在作业节点中已自定义血缘关系的输入表和输出表。当存在运行成功的数据开发作业调度任务时，系统会生成作业中的血缘关系，并在数据目录中进行可视化展示。数据血缘的生成和展示，详情请参见节点数据血缘。父主题：数据目录

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
新建数据质量规则 - 数据治理中心 DataArts Studio

通过“导出”功能，可将数据直接/或修改后批量导入系统。通过“下载Excel模板”，将数据填写好再导入至系统中。配置目录的映射资源信息，选择导入后的规则模板存储目录。如不选择，默认使用原映射资源信息。图11 配置映射资源信息单击“导入”，将填好的Excel表格模板导入到系统。单击“导入记录”页签，可查看对应的导入记录。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
管理通知 - 数据治理中心 DataArts Studio

开关是是否开启通知，默认开启。单击“确定”，为作业配置通知。数据开发模块的通知管理功能是通过消息通知服务来发送消息，消息通知服务的使用可能会产生费用，具体请咨询消息通知服务。一个作业支持配置多个消息主题，当作业运行成功或失败，可同时向多个订阅了消息主题的终端发送通知。编辑通知

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 通知管理
合理配置基线承诺时间和预警余量 - 数据治理中心 DataArts Studio

基线承诺时间是任务运行成功的最晚时间点。即面向数据应用，任务承诺在该时间点前完成。如果希望为运维人员预留一定的时间处理异常，用户可以为基线设置预警余量，则系统会将承诺时间-预警余量作为触发报警的预警时间，判断任务能否在预警时间前运行成功。设置基线承诺时间和预警余量的详细信息请参见基线管理。如何合理的配置基线承诺时间和预警余量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 基线运维
数据架构示例 - 数据治理中心 DataArts Studio

SDI：Source Data Integration，又称贴源数据层。SDI是源系统数据的简单落地。 DWI：Data Warehouse Integration，又称数据整合层。DWI整合多个源系统数据，对源系统进来的数据进行整合、清洗，并基于三范式进行关系建模。维度建模：在DWR层

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 使用教程

总条数： 1333

上一页
1
2
3
4
5
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看数据血缘 - 数据治理中心 DataArts Studio

逻辑模型 - 数据治理中心 DataArts Studio

DataArts Studio和ROMA有什么差异？ - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

Python - 数据治理中心 DataArts Studio

配置OBS桶 - 数据治理中心 DataArts Studio

业务指标 - 数据治理中心 DataArts Studio

IF条件判断教程 - 数据治理中心 DataArts Studio

通过CDM节点批量创建分表迁移作业 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

MRS Spark - 数据治理中心 DataArts Studio

执行SQL语句失败，系统提示“Failed to create ThriftService instance, please check the cluster has available resources and check YARN or Spark - 数据治理中心 DataArts Studio

关系建模 - 数据治理中心 DataArts Studio

逆向数据库（关系建模） - 数据治理中心 DataArts Studio

CDM Job - 数据治理中心 DataArts Studio

数据目录如何可视化展示数据血缘？ - 数据治理中心 DataArts Studio

新建数据质量规则 - 数据治理中心 DataArts Studio

管理通知 - 数据治理中心 DataArts Studio

合理配置基线承诺时间和预警余量 - 数据治理中心 DataArts Studio

数据架构示例 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线