搜索_华为云

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

分区表桶数 = MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

内存集群并发数上限参考 cdm.large 8核 16GB 16 cdm.xlarge 16核 32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

内存集群并发数上限参考 cdm.large 8核 16GB 16 cdm.xlarge 16核 32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM作业配置管理 - 数据治理中心 DataArts Studio

源端为Hive数据源且使用JDBC方式读取数据时，CDM不支持多并发，此时应配置为单进程抽取数据。目的端为DLI数据源时，抽取并发数建议配置为1，否则可能会导致写入失败。定时备份/恢复该功能依赖于OBS服务。当前定时备份内容不会自动老化删除，您需要定期手动清理备份文件。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

支持单AZ和多AZ两种部署方式。推荐使用多AZ方式。单AZ：仅可以选择1个AZ，集群节点部署在同一AZ上。多AZ：可选择2-10个AZ，集群节点部署在不同AZ上，以提升集群的容灾能力。详情请参见什么是可用区。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

debezium.max.queue.size int 8192 数据缓存队列条数，默认为8192，当源表中单条数据过大时（如1MB），缓存过多数据会导致内存溢出，可以考虑减小该值。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
性能调优概述 - 数据治理中心 DataArts Studio

Mysql\Oracle\SqlServer\PostGres\OpenGauss等关系型数据为保证事务有序，在增量阶段是单并发抽取，加大并发一般不会提升抽取性能。如果第2步也无法有效提升性能，请参考对应链路性能调优文档尝试进行参数优化。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
数据架构API概览 - 数据治理中心 DataArts Studio

10800 120 审批管理接口表9 审批管理接口 API 说明 API流量限制（次/min）用户流量限制（次/min）获取审批单获取审批单。 21600 240 撤回审批单撤回审批单。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > API概览
查询角色对一组库、表的可配置操作权限信息 - 数据治理中心 DataArts Studio

schemas 否 Array of strings dws权限涉及 schema，预留字段，在做DWS批量授权时应保持单schema下的批量授权，或者对单库下schema批量授权。 table_names 否 Array of strings 数据表列表。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 数据权限查询接口
创建数据连接需要注意哪些事项？ - 数据治理中心 DataArts Studio

CDM集群作为管理中心数据连接Agent时，单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时，通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运行上限为200，超出的任务将排队等待。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 管理中心
配置离线处理集成作业 - 数据治理中心 DataArts Studio

是单并发速率上限(MB/s) 开启限速情况下设置的单并发速率上限值，如果配置多并发则实际速率限制需要乘以并发数。说明：限制速率为大于1的整数。 10 中间队列缓存大小数据写入时中间队列缓存大小，取值范围为1-500。如果单行数据超过该值，可能会导致迁移失败。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
组合识别规则测试 - 数据治理中心 DataArts Studio

combine_input_data 否 combine_input_data object 模拟数据 combine 否 Boolean 分类ID single_rule_check_list 否 Array of DataClassificationSingleRuleDTO objects 条件单规则列表

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 识别规则接口
OCR - 数据治理中心 DataArts Studio

可支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。识别结果存储目录是指定识别结果存储的OBS目录。表2 高级参数参数是否必选说明节点执行的最长时间是设置节点执行的超时时间，如果节点配置了重试，在超时时间内未执行完成，该节点将会再次重试。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

说明： CDM集群作为管理中心数据连接Agent时，单集群的并发活动线程最大为200。即当多个数据连接共用同一Agent时，通过这些数据连接提交SQL脚本、Shell脚本、Python脚本等任务的同时运行上限为200，超出的任务将排队等待。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
管理回收站 - 数据治理中心 DataArts Studio

单实例下回收站中的权限集和动态脱敏策略分别最多保存1000条数据，超过1000条后会自动清理更早删除的数据。数据还原操作时，如果“同名处理方式”参数配置为“名称添加时间戳”，则如果同名会在还原数据的原名称后添加时间戳信息（原名称_13位时间戳）。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据安全
性能调优 - 数据治理中心 DataArts Studio

内存集群并发数上限参考 cdm.large 8核 16GB 16 cdm.xlarge 16核 32GB 32 cdm.4xlarge 64核 128GB 128 图1 集群最大抽取并发数配置作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
创建规则分组接口 - 数据治理中心 DataArts Studio

method 是 String 规则方式, COMBINE single_expressions 是 Array of DataClassificationSingleRuleDTO objects 条件单规则表5 DataClassificationSingleRuleDTO

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 规则分组接口
创建组合识别规则 - 数据治理中心 DataArts Studio

single_expressions 是 Array of DataClassificationSingleRuleDTO objects 条件单规则表4 DataClassificationSingleRuleDTO 参数是否必选参数类型描述 rule_code 是 String

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据安全API > 识别规则接口
迁移作业原理 - 数据治理中心 DataArts Studio

迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能

总条数： 164

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

购买数据服务专享集群增量包 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

性能调优概述 - 数据治理中心 DataArts Studio

数据架构API概览 - 数据治理中心 DataArts Studio

查询角色对一组库、表的可配置操作权限信息 - 数据治理中心 DataArts Studio

创建数据连接需要注意哪些事项？ - 数据治理中心 DataArts Studio

配置离线处理集成作业 - 数据治理中心 DataArts Studio

组合识别规则测试 - 数据治理中心 DataArts Studio

OCR - 数据治理中心 DataArts Studio

OpenSource ClickHouse数据连接参数说明 - 数据治理中心 DataArts Studio

管理回收站 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

创建规则分组接口 - 数据治理中心 DataArts Studio

创建组合识别规则 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线