搜索_华为云

数据架构使用流程 - 数据治理中心 DataArts Studio

Integration，又称数据整合层。DWI整合多个源系统数据，对源系统进来的数据进行整合、清洗，并基于三范式进行关系建模。维度建模：基于维度建模，新建DWR层模型并发布维度和事实表。 DWR：Data Warehouse Report，又称数据报告层。DWR基于多维模型，和DWI层数据粒度保持一致。维

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构
CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

其它可选参数保持默认即可。单击“下一步”进行任务配置，其中抽取并发数默认为3，适当增加可以增加迁移速率，本例中设置为8，其它参数保持默认即可。重复上述步骤创建其它迁移目录的作业，参数配置都相同。2个CDM集群的作业个数平均分配，并发执行。作业执行完成后，可在作业的“历史记录”中查看详细的数据统计。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 车联网大数据零丢失搬迁入湖
配置Hive源端参数 - 数据治理中心 DataArts Studio

JDBC方式读取数据时，支持使用WHERE条件进行数据过滤及在字段映射页面添加新字段。说明：源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，即后续操作中抽取并发数只能设置为1。 HDFS 使用SQL语句导出关系型数据库的数据时，您可以选择使用自定义SQL语句导出。否 SQL语句 “使

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置实时集成作业 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业）
批作业监控 - 数据治理中心 DataArts Studio

因为DataArts Studio不支持底层服务（例如，以前的CDM、DLI等服务）的补数据实例和周期调度作业实例并发运行，为了保证补数据实例不影响周期调度作业实例运行，两种类型作业实例不会抢占并发，所以，作业的周期调度的日期与该作业补数据的业务日期不能重合，周期调度和补数据不能同时运行，避免出现运行异常问题。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度 > 作业监控
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Hudi flush数据时的并发数，默认为1，即顺序写入。当Hud单次commit涉及FleGroup较多时（如源端表较多更新历史数据的场景），考虑增大该值。已知单线程flush的FileGroup的数据 = 单次Commit的FileGroup数量 / 作业并发数。单线程flush的FileGroup的数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

MapReduce服务（MRS Doris） Doris是一个高性能、实时的分析型数据库，仅需亚秒级响应时间即可返回海量数据下的查询结果，不仅可以支持高并发的点查询场景，也能支持高吞吐的复杂分析场景。因此，Apache Doris能够较好的满足报表分析、即时查询、统一数仓构建、数据湖联邦查询加速等使用场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心
MRS Spark SQL - 数据治理中心 DataArts Studio

否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。表3 血缘关系参数说明输入新建单击“新建”，在“类型”的下拉选项中选择要新

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Hudi flush数据时的并发数，默认为1，即顺序写入。当Hud单次commit涉及FleGroup较多时（如源端表较多更新历史数据的场景），考虑增大该值。已知单线程flush的FileGroup的数据 = 单次Commit的FileGroup数量 / 作业并发数。单线程flush的FileGroup的数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置 - 数据治理中心 DataArts Studio

配置配置环境变量配置OBS桶管理作业标签配置调度身份配置节点并发数配置模板配置调度日历配置默认项配置任务组配置互斥父主题：配置管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
配置Oracle目的端参数 - 数据治理中心 DataArts Studio

into loader线程数每个loader内部启动的线程数，可以提升写入并发数。说明：不支持“约束冲突处理”策略为“replace into”或“on duplicate key update”的并发场景。 1 父主题：配置CDM作业目的端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业目的端参数
配置Doris目的端参数 - 数据治理中心 DataArts Studio

执行任务之后执行的SQL语句，目前仅允许执行一条SQL语句。 merge into loader线程数每个loader内部启动的线程数，可以提升写入并发数。并发场景下有如下限制：约束冲突处理策略不支持"replace into"或"on duplicate key update"。 1 stream

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
基本概念 - 数据治理中心 DataArts Studio

据，或者直接复制源文件的“副本数据”。数据连接定义访问数据实体存储（计算）空间所需的信息的集合，包括连接类型、名称和登录信息等。并发数并发数是数据集成作业中，可以从源端并行读取的最大线程数。脏数据脏数据是对于业务没有意义或者格式非法的数据。例如，源端是VARCHAR类

 帮助中心 > 数据治理中心 DataArts Studio > 产品介绍
管理维度表 - 数据治理中心 DataArts Studio

维度表与维度一一对应，通过丰富维度中的属性信息构建形成。维度表的生命周期（包括新建、发布、编辑、下线操作）通过维度进行管理，在维度发布成功后，系统会自动创建并发布对应的维度表。查看维度表发布历史在数据架构控制台，选择“模型设计 > 维度建模”，进入维度建模页面。单击“维度表”页签，进入维度表页面。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
新建数据对账作业 - 数据治理中心 DataArts Studio

带上主题层级如、等进行展示。主题修改后再次同步名称冲突时，会出现同步失败的情况。不支持变更自动同步。即数据架构处的主题或主题层级变更并发布后，需要手动再次单击才能同步到主题目录。特殊的，数据架构处的主题或主题层级删除后，手动同步后目录不会删除，仅去除主题目录属性，作为普通目录进行展示。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 数据质量监控
PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

作业执行分配内存，跟随处理器核数变化而自动变化。 8GB 处理器核数范围：2-32。每增加1处理核数，则自动增加4G执行内存和1并发数。 2 并发数作业执行支持并发数。该参数无需配置，跟随处理器核数变化而自动变化。 1 自动重试作业失败时是否开启自动重试。否最大重试次数 “自动重试”为是时显示该参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程

总条数： 321

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据架构使用流程 - 数据治理中心 DataArts Studio

CDM迁移近一个月的数据 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

配置实时集成作业 - 数据治理中心 DataArts Studio

批作业监控 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

DataArts Studio支持的数据源 - 数据治理中心 DataArts Studio

MRS Spark SQL - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

配置 - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

配置Oracle目的端参数 - 数据治理中心 DataArts Studio

配置Doris目的端参数 - 数据治理中心 DataArts Studio

基本概念 - 数据治理中心 DataArts Studio

管理维度表 - 数据治理中心 DataArts Studio

新建数据对账作业 - 数据治理中心 DataArts Studio

PostgreSQL同步到DWS作业配置 - 数据治理中心 DataArts Studio

Oracle同步到DWS作业配置 - 数据治理中心 DataArts Studio

DMS Kafka同步到OBS作业配置 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线