搜索_华为云

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。 changelog.enabled boolean false - Hudi changelog功能

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
修改资源 - 数据治理中心 DataArts Studio

d。请求参数表2 请求Header参数参数名是否必选参数类型说明 workspace 否 String 工作空间id。如果不设置该参数，默认查询default工作空间下的数据。如果需要查询其他工作空间的数据，需要带上该消息头。表3 Resource参数说明参数名

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据开发API（V1） > 资源管理API
PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Oracle到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

编辑空间管理在“空间信息”中，单击“设置”按钮对已分配配额进行配置。图4 设置已分配配额数据服务已创建的API属于计费项，当前操作正在增加API配额，这会使工作空间下可以创建更多的API，同时可能使收费增加，请确认。设置专享版API已分配配额。图5 设置配额已分配配额不能小于已使

 帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据服务
查看数据血缘 - 数据治理中心 DataArts Studio

查看数据血缘首先在数据目录组件完成元数据采集任务，当数据开发作业满足自动血缘解析要求或已手动配置血缘，然后成功完成作业调度后，则可以在数据目录模块可视化查看数据血缘关系。约束限制数据血缘关系更新依赖于作业调度，数据血缘关系是基于最新的作业调度实例产生的。对于同一版本的数据

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考 > 节点数据血缘
Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

重新启动输入数据路径否设置输入数据路径，系统支持从HDFS或OBS的目录路径进行配置。输出数据路径否设置输出数据路径，系统支持从HDFS或OBS的目录路径进行配置。表2 配置高级参数参数是否必选说明作业状态轮询时间（秒）是设置轮询时间（30~60秒、12

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

消费者是从Topic订阅消息的一方，消费组是由一个或多个消费者组成的。Migration支持指定本次消费动作所属的Kafka消费组。 Kafka源端属性配置支持设置Kafka的配置项，需要增加 properties. 前缀，作业将自动移除前缀并传入底层Kafka客户端，具体参数可参考 Apache Kafka官方文档

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
Open/Close Resource - 数据治理中心 DataArts Studio

开关机设置是选择开关机类型：开关开关机对象是选择需要开机/关机的具体对象，例如开启某个CDM集群。表2 高级参数参数是否必选说明节点状态轮询时间（秒）是设置轮询时间（1~60秒），每隔x秒查询一次节点是否执行完成。节点执行的最长时间是设置节点执行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
Redis连接参数说明 - 数据治理中心 DataArts Studio

Redis数据库索引 Redis分库的索引标识。 Redis的分库，相当于关系型数据库中的database。分库总数可以在Redis配置文件中设置，默认是16个，分库名称是一个整数（0～15），不是一个字符串。 0 认证类型访问MRS的认证类型： SIMPLE：非安全模式选择Simple鉴权。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
购买数据模型数量增量包 - 数据治理中心 DataArts Studio

作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买配额扩充增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买配额扩充增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

文件。图4 选择JSON文件 JSON文件上传成功后，单击“设置密码”，配置数据连接的密码或SK。图5 进入设置密码在设置密码弹窗中，依次输入各数据连接的密码或SK，完成后单击确认，回到导入作业界面。图6 设置密码在导入作业界面，单击确认，开始导入。图7 开始导入导

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
迁移作业原理 - 数据治理中心 DataArts Studio

创建CDM迁移作业时，支持设置该作业的抽取并发数。该参数设置为适当的值可以有效提升迁移速度，过小则会限制迁移速度，过大则会导致任务过载、迁移失败。迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
性能调优 - 数据治理中心 DataArts Studio

避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。 CDM通过数据迁移作业，将源端数据迁移到目的端数据源中。其中，主要运行逻辑如下：数据迁移作业提交运行

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
添加工作空间成员和角色 - 数据治理中心 DataArts Studio

发责任人、运维管理员设置为管理员角色。开发者：开发者拥有工作空间内创建、管理工作项的业务操作权限。建议将任务开发、任务处理的用户设置为开发者。运维者：运维者具备工作空间内运维调度等业务的操作权限，但无法更改工作项及配置。建议将运维管理、状态监控的用户设置为运维者。访客：访客

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 授权用户使用DataArts Studio
购买技术资产数量增量包 - 数据治理中心 DataArts Studio

作 > 配额使用量”，查看每个工作空间的配额使用量。设置配额使用量阈值告警购买配额扩充增量包前，您可以设置配额使用量阈值告警。当触发告警时，表明您应当购买配额扩充增量包，否则随着业务量增长，您的业务可能会受到影响。设置配额使用量阈值告警的操作方法如下所示：在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio > 购买DataArts Studio增量包
SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

MAX(单分区数据量大小(G)/2G*2，再后向上取整，1)。其中，要注意的是：需要使用的是表的总数据大小，而不是压缩以后的文件大小。桶的设置以偶数最佳，非分区表最小桶数请设置4个，分区表最小桶数请设置1个。同时，可通过在Hudi的目的端配置中单击“Hudi表属性全局配置”或在映射后的单表“表属性编辑”中，添加优化参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
跨空间进行作业调度 - 数据治理中心 DataArts Studio

Dummy节点不执行任何操作，本例选择Dummy节点用于设置Dummy节点到Subjob节点之间连线的IF条件。 Subjob节点用于将需要后续执行的作业job2作为子作业引用执行。实际使用中您可以引用已有作业，也可以使用其他作业节点替代Subjob节点。作业的调度方式设置为“事件驱动调度”，DIS通道

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

DWS的写入模式，可在目的端配置中设置，实时处理集成作业推荐使用COPY MODE。 UPSERT：为批量更新入库模式。 COPY：为DWS专有的高性能批量入库模式。批写最大数据量 int 50000 DWS单次写入的最大条数，可在目的端配置中设置。当缓存的数据达到“批写最大数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优

总条数： 518

上一页
1
...
8
9
10
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Oracle同步到MRS Hudi作业配置 - 数据治理中心 DataArts Studio

修改资源 - 数据治理中心 DataArts Studio

PostgreSQL到DWS参数调优 - 数据治理中心 DataArts Studio

Oracle到DWS参数调优 - 数据治理中心 DataArts Studio

数据服务专享版集群正式商用后，如何继续使用公测期间创建的数据服务专享版集群和API？ - 数据治理中心 DataArts Studio

查看数据血缘 - 数据治理中心 DataArts Studio

Flink Jar作业开发指导 - 数据治理中心 DataArts Studio

Apache Kafka同步到MRS Kafka作业配置 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

Oracle到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

Redis连接参数说明 - 数据治理中心 DataArts Studio

购买数据模型数量增量包 - 数据治理中心 DataArts Studio

数据集成配置数据搬迁 - 数据治理中心 DataArts Studio

迁移作业原理 - 数据治理中心 DataArts Studio

性能调优 - 数据治理中心 DataArts Studio

添加工作空间成员和角色 - 数据治理中心 DataArts Studio

购买技术资产数量增量包 - 数据治理中心 DataArts Studio

SQLServer到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

MySQL到DWS参数调优 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线