搜索_华为云

什么是数据血缘关系？ - 数据治理中心 DataArts Studio

多源性：同一个数据可以有多个来源（多个父亲）。一个数据可以是多个数据经过加工而生成的，而且这种加工过程可以是多个。可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据目录
CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？问题描述 CDM迁移数据到DWS时如何选取分布列？解决方案在使用CDM迁移数据到数据仓库服务（DWS）或者FusionInsight LibrA，且CDM在DWS端自动创建一个新表时，在创建作业的字段映射界面，需要选择分布列，如图1所示。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
文件格式介绍 - 数据治理中心 DataArts Studio

0 }] 记录节点记录数据的根节点。该节点对应的数据为JSON数组，CDM会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分隔。从JSON文件复制数据示例一从行分隔/串连的多个对象中提取数据。JSON文件包含了多个JSON对象，例如： { "took":

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 关键操作指导
文件格式介绍 - 数据治理中心 DataArts Studio

0 }] 记录节点记录数据的根节点。该节点对应的数据为JSON数组，CDM会以同一模式从该数组中提取数据。多层嵌套的JSON节点以字符“.”分隔。从JSON文件复制数据示例一从行分隔/串连的多个对象中提取数据。JSON文件包含了多个JSON对象，例如： { "took":

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据迁移进阶实践
配置实时集成作业 - 数据治理中心 DataArts Studio

不归档：不对脏数据进行存储，仅记录到任务日志中。归档到OBS：将脏数据存储到OBS中，并打印到任务日志中。不归档脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 - 脏数据目录脏数据写入的OBS目录。 - 脏数据阈值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
配置OBS目的端参数 - 数据治理中心 DataArts Studio

CSV格式：按CSV格式写入，适用于数据表到文件的迁移。 Parquet格式：按Parquet格式写入，适用于数据表到文件的迁移。 ORC格式：按ORC格式写入，适用于数据表到文件的迁移。二进制格式：选择“二进制格式”时不解析文件内容直接传输，CDM会原样写入文件，不改变原始文件格式，适用于文件到文件的迁移。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

全部投递到Partition 0。按源端分区投递到对应的Partition：源端消息在第n个分区，则投递到目的端的第n个分区，该策略可以保证消息顺序。按轮询模式投递到不同的Partition：采用Kafka粘性分区策略均匀的投递到目的端主题的所有分区，该策略无法保证消息顺序。新建Topic的Partition数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置Kafka源端参数 - 数据治理中心 DataArts Studio

用户指定消费组ID。如果是从DMS Kafka导出数据，专享版请任意输入，标准版请输入有效的消费组ID。 sumer-group 消费记录策略消费record策略。起止时间：根据kafka record元数据TIMESTAMP判断，抽取的record是否符合填入的起止时间范围。当消费到的rec

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
常用EL表达式样例合集 - 数据治理中心 DataArts Studio

current表示当前遍历到的For Each节点“数据集”中定义的二维数组的某一行，该数据行为一维数组。一般定义格式为#{Loop.current[0]}、#{Loop.current[1]}或其他。其中[0]表示遍历到的当前行的第一个值，[1]表示遍历到的当前行的第二个值，以此类推。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > EL表达式参考
约束与限制 - 数据治理中心 DataArts Studio

数据源的连接密码导出。因此在将作业配置重新导入到CDM前，需要手工编辑导出的JSON文件补充密码或在导入窗口配置密码。不支持集群自动升级到新版本，需要用户通过作业的导出和导入功能，实现升级到新版本。在无OBS的场景下，CDM系统不会自动备份用户的作业配置，需要用户通过作业的导出功能进行备份。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业）
新建时间限定 - 数据治理中心 DataArts Studio

根据需要选择“快速选择”或“自定义”进行时间条件的设置。自定义时，“-”表示从当前时间向前的时间段，“+”表示从当前时间向后的时间段。例如，过去一年到未来三年，可以按年自定义为“-1到+3”或“+3到-1”。描述描述信息。支持的长度0~490字符。在弹出框中，选择审核人，单击“确认提交”，提交发布审核。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 指标设计 > 技术指标
时间周期 - 数据治理中心 DataArts Studio

根据需要选择“快速选择”或“自定义”进行时间条件的设置。自定义时，“-”表示从当前时间向前的时间段，“+”表示从当前时间向后的时间段。例如，过去一年到未来三年，可以按年自定义为“-1到+3”或“+3到-1”。描述描述信息。支持的长度0~490字符。基本参数配置完成后，单击

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据指标 > 指标开发
数据架构概述 - 数据治理中心 DataArts Studio

建维度、新建事实表、数据集市。同步单击“更多 > 同步”，可以同步表到数据目录，作为技术资产；同步逻辑模型到数据目录，作为业务资产。企业模式下，进行同步时，可以选择同步到生产环境或开发环境。系统默认同步到生产环境。修改主题单击“更多 > 修改主题”，可以将选中的表更改到其它主题。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
数据血缘方案简介 - 数据治理中心 DataArts Studio

多源性：同一个数据可以有多个来源（多个父亲）。一个数据可以是多个数据经过加工而生成的，而且这种加工过程可以是多个。可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
数据血缘方案简介 - 数据治理中心 DataArts Studio

多源性：同一个数据可以有多个来源（多个父亲）。一个数据可以是多个数据经过加工而生成的，而且这种加工过程可以是多个。可追溯性：数据的血缘关系，体现了数据的生命周期，体现了数据从产生到消亡的整个过程，具备可追溯性。层次性：数据的血缘关系是有层次的。对数据的分类、归纳、总结等对数据进行的描述信息又形成了新的数据，不同程度的描述信息形成了数据的层次。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
配置OBS目的端参数 - 数据治理中心 DataArts Studio

world，使用包围符后，导出到CSV文件的时候数据为"hello,world"。否首行为标题行从关系型数据库导出数据到OBS，“文件格式”为“CSV格式”时，才有该参数。在迁移表到CSV文件时，CDM默认是不迁移表的标题行，如果该参数选择“是”，CDM在才会将表的标题行数据写入文件。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
概述 - 数据治理中心 DataArts Studio

数据开发、数据质量、数据目录、数据服务等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业快速构建从数据接入到数据分析的端到端智能数据系统，消除数据孤岛，统一数据标准，加快数据变现，实现数字化转型。您可以使用本文档提供的API对数据治理中心的

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 使用前必读
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

不归档：不对脏数据进行存储，仅记录到任务日志中。归档到OBS：将脏数据存储到OBS中，并打印到任务日志中。不归档脏数据写入连接 “脏数据策略”选择归档到OBS时显示该参数。脏数据要写入的连接，目前只支持写入到OBS连接。 - 脏数据目录脏数据写入的OBS目录。 - 脏数据阈值

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
数据集成（CDM作业） - 数据治理中心 DataArts Studio

MySQL迁移时报错“JDBC连接超时”怎么办？创建了Hive到DWS类型的连接，进行CDM传输任务失败时如何处理？如何使用CDM服务将MySQL的数据导出成SQL文件，然后上传到OBS桶？如何处理CDM从OBS迁移数据到DLI出现迁移中断失败的问题？如何处理CDM连接器报错“配置项

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题
配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

作业中目的连接为HBase连接或CloudTable连接时，即导入数据到以下数据源时，目的端作业参数如表1所示。表1 HBase/CloudTable作为目的端时的作业参数参数名说明取值样例表名写入数据的HBase表名。如果是创建新HBase表，支持从源端复制字段名。单击输入框后面的按钮可进入表的选择界面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数

总条数： 210

上一页
1
2
3
4
5
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

什么是数据血缘关系？ - 数据治理中心 DataArts Studio

CDM迁移数据到DWS时如何选取分布列？ - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

文件格式介绍 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

配置Kafka源端参数 - 数据治理中心 DataArts Studio

常用EL表达式样例合集 - 数据治理中心 DataArts Studio

约束与限制 - 数据治理中心 DataArts Studio

新建时间限定 - 数据治理中心 DataArts Studio

时间周期 - 数据治理中心 DataArts Studio

数据架构概述 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

数据血缘方案简介 - 数据治理中心 DataArts Studio

配置OBS目的端参数 - 数据治理中心 DataArts Studio

概述 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

数据集成（CDM作业） - 数据治理中心 DataArts Studio

配置HBase/CloudTable目的端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线