搜索_华为云

DWS/Hive/HBase数据连接无法获取数据库或表的信息怎么办？ - 数据治理中心 DataArts Studio

DWS/Hive/HBase数据连接无法获取数据库或表的信息怎么办？可能原因可能是由于CDM集群被关闭或者并发冲突导致，您可以通过切换agent代理来临时规避此问题。解决方案建议您通过以下措施解决此问题：检查CDM集群是否被关机。是，将CDM集群开机后，确认管理中心的数据连接恢复正常。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
DLI Flink Job - 数据治理中心 DataArts Studio

次重试，或选择自建队列运行业务。 CUs 是 CUs为DLI计费单位，一个CU是1核4G的资源配置。并发数是并发数是指同时运行Flink SQL作业的任务数。说明：并发数不能大于计算单元（CUs-1）的4倍。异常自动启动否设置是否启动异常自动重启功能，当作业异常时将自动重启并恢复作业。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
示例场景说明 - 数据治理中心 DataArts Studio

标准管理新建码表并发布新建数据标准并发布关系建模数仓规划：新建SDI层和DWI层两个模型维度建模维度建模：在DWR层新建并发布维度维度建模：在DWR层新建并发布事实表指标设计指标设计：新建并发布技术指标数据集市建设数据集市：在DM层新建并发布汇总表步骤6：数据开发处理

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
开发Shell脚本 - 数据治理中心 DataArts Studio

连接参数说明。连接主机的用户需要具有主机/tmp目录下文件的创建与执行权限。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_config文件中MaxSessions的配置值确定。请根据Shell或Python脚本的调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 脚本开发 > 开发脚本
创建CDM集群 - 数据治理中心 DataArts Studio

CDM采用独立集群的方式为用户提供安全可靠的数据迁移服务，各集群之间相互隔离，不可相互访问。 CDM集群可用于如下场景：用于创建并运行数据迁移作业。作为管理中心组件连接数据湖时的Agent代理。前提条件已申请VPC、子网和安全组。CDM集群连接云上其它服务时，需确保CDM集群与待连接的云服务在同一个VP

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
新建整库迁移作业 - 数据治理中心 DataArts Studio

说明取值样例同时执行的表个数抽取时并发执行的表的数量。 3 抽取并发数当前任务从源端进行读取最大线程数。说明：由于数据源限制，实际执行时并发的线程数可能小于等于此处配置的并发数，如CSS，ClickHouse数据源不支持多并发抽取。 1 是否写入脏数据选择是否记录脏数据，默认不记录脏数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
新建一个对账作业实例 - 数据治理中心 DataArts Studio

新建一个对账作业实例场景说明数据对账对于数据开发和数据迁移流程中的数据一致性至关重要，而跨源数据对账的能力是检验数据迁移或数据加工前后是否一致的关键指标。本章分别以DLI和DWS作为数据源，介绍如何通过DataArts Studio中的数据质量模块实现跨源数据对账的基本一致性校验。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据质量 > 使用教程
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

大的场景，可以适当调高每次获取的数据量，以提高性能。目的端优化 Kafka写入优化 Kafka写入通常速率极快，若有阻塞的场景请优先增加并发解决。父主题：任务性能调优

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

效。最大抽取并发数：限制作业运行的总抽取并发数，如果当前所有作业总并发数超出限制，超出部分将排队等待。注意，最大抽取并发数取值范围为1-1000，建议根据集群规格进行配置，建议值详见最大抽取并发数。过高的并发数可能导致内存溢出，请谨慎修改。此处的“最大抽取并发数”参数与作业

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 创建并管理CDM集群
配置任务组 - 数据治理中心 DataArts Studio

任务组的名称。任务组名称不能重名。最大并发数当前任务组作业节点最大并发数。最大节点并发数即为当前DataArts Studio实例的并发数。当前DataArts Studio实例的节点并发数上限为1000，请不要超过该上限。最大并发数与DataArts Studio实例规

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
For Each - 数据治理中心 DataArts Studio

],["\"01\""]];[['\'00\''],['\'01\'']] 子作业并发数是循环产生的子作业可以并发执行，您可设置并发数。说明：如果子作业中包含CDM Job节点，子作业并发数需要设置为1。子作业实例名称后缀否 For循环生成的子任务名称：For循环节点名称

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
数据集成（CDM作业） - 数据治理中心 DataArts Studio

的费用？如何查看套餐包的剩余时长？ CDM可以跨账户使用吗？ CDM集群是否支持升级操作？ CDM迁移性能如何？ CDM不同集群规格对应并发的作业数是多少？是否支持增量迁移？是否支持字段转换？ Hadoop类型的数据源进行数据迁移时，建议使用的组件版本有哪些？数据源为Hive时支持哪些数据格式？

帮助中心 > 数据治理中心 DataArts Studio > 常见问题
性能调优概述 - 数据治理中心 DataArts Studio

a\hudi等数据源抽取速度慢，请优先尝试加大作业并发数，以提高作业的并发抽取速率。 Mysql\Oracle\SqlServer\PostGres\OpenGauss等关系型数据为保证事务有序，在增量阶段是单并发抽取，加大并发一般不会提升抽取性能。如果第2步也无法有效提升性能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行可开启。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数，适当的抽取并发数可以提升迁移效率，配置原则请参见性能调优。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

fka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。目的端优化 OBS写入优化若开启了自动合并可尝试关闭，否则请优先增加并发解决。父主题：任务性能调优

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

CLICKHOUSE_0_3_1：适用于连接ClickHouse 20.7以下版本，此驱动版本不支持多IP连接数据库服务器。 CLICKHOUSE_0_4_2：适用于连接ClickHouse 20.7及以上版本，支持多IP连接数据库服务器。说明：选择CLICKHOUSE_0_4_2驱动版本时，支持的ti

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置离线处理集成作业 - 数据治理中心 DataArts Studio

迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并发数建议配置为1，否则可能会导致写入失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
步骤5：数据架构设计 - 数据治理中心 DataArts Studio

员审核通过后，业务对象发布成功。如果当前账号具备审核人权限，也可以勾选“自助审批”，直接提交即可以审核通过。图9 发布业务对象新建码表并发布在本示例中，您需要新建如表2所示的3个码表：表2 码表目录 *表名称 *表编码表描述 *字段名称 *字段编码 *字段数据类型字段描述

 帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 企业版：基于MRS Hive的出租车出行数据治理流程
参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

65075 90155（并发度：10） 86248 86248（并发度：1） 76687 76687（并发度：1） DWS 8U 16G 8.1.1.300 26624 27902（并发度：10） DLI 16U SQL队列 15211 18430（并发度：10） MRS Hudi（MOR）

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
开发一个Python作业 - 数据治理中心 DataArts Studio

选择CDM集群，CDM集群提供Agent。如果没有可用的CDM集群，请参考创建CDM集群进行创建。说明： CDM集群作为管理中心数据连接Agent时，单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时，通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程

总条数： 321

上一页
1
2
3
4
5
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DWS/Hive/HBase数据连接无法获取数据库或表的信息怎么办？ - 数据治理中心 DataArts Studio

DLI Flink Job - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

开发Shell脚本 - 数据治理中心 DataArts Studio

创建CDM集群 - 数据治理中心 DataArts Studio

新建整库迁移作业 - 数据治理中心 DataArts Studio

新建一个对账作业实例 - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

查看并修改CDM集群配置 - 数据治理中心 DataArts Studio

配置任务组 - 数据治理中心 DataArts Studio

For Each - 数据治理中心 DataArts Studio

数据集成（CDM作业） - 数据治理中心 DataArts Studio

性能调优概述 - 数据治理中心 DataArts Studio

OBS数据迁移到DLI服务 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

步骤5：数据架构设计 - 数据治理中心 DataArts Studio

参考：CDM性能实测数据 - 数据治理中心 DataArts Studio

开发一个Python作业 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线