搜索_华为云

配置节点并发数 - 数据治理中心 DataArts Studio

配置节点并发数本章节主要介绍如何配置当前作业空间同一时间允许正在运行的作业节点的最大并发数。约束限制工作空间的节点并发数不能大于实例的节点并发数上限。配置方法参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。在DataArts

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
配置任务组 - 数据治理中心 DataArts Studio

择任务组，即可按照设置好的任务组更细粒度的进行当前任务组中的作业节点的并发数控制。后续操作修改：单击“修改”，可以修改已配置好的任务组。任务组的修改是实时生效的。删除：单击“删除”，可以删除已配置好的任务组。如果任务组被作业引用，无法删除。查看引用：单击“查看引用”，可以查看该任务组被引用的详细信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
CDM作业配置管理 - 数据治理中心 DataArts Studio

128 作业抽取并发数的配置原则如下：迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。源端

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并发数建议配置为1，否则可能会导致写入失败。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

迁移的目的端为文件时，CDM不支持多并发，此时应配置为单进程抽取数据。表中每行数据大小为1MB以下的可以设置多并发抽取，超过1MB的建议单线程抽取数据。作业抽取并发数可参考集群最大抽取并发数配置，但不建议超过集群最大抽取并发数上限。目的端为DLI数据源时，抽取并发数建议配置为1，否则可能会导致写入失败。

帮助中心 > 数据治理中心 DataArts Studio > 常见问题 > 数据集成（CDM作业）
配置 - 数据治理中心 DataArts Studio

配置配置环境变量配置OBS桶管理作业标签配置调度身份配置节点并发数配置模板配置调度日历配置默认项配置任务组配置互斥父主题：配置管理

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理
数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

Administrator权限。每个工作空间每分钟仅能全量导出一次，同时只能有一个全量导出任务执行。在导出窗口中单击“确认”导出全量API，单击确认即可以Excel文件的形式导出API。图1 全量导出API 打开下载到本地的Excel文件，可以查看导出的API。不同类型的API会分别导出到文件页签中，单击下方页签可以切换查看并编辑。

帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > DataArts Studio配置数据搬迁实践
主机连接参数说明 - 数据治理中心 DataArts Studio

如果密钥对未设置密码，则不需要填写该配置项。密码是 “登录方式”为“密码”时，显示该配置项。主机的登录方式为密码时，填写主机的登录密码。主机连接描述否主机连接的描述信息。 Shell或Python脚本可以在该ECS主机上运行的最大并发数由ECS主机的/etc/ssh/sshd_

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 管理中心 > 配置DataArts Studio数据连接参数
配置互斥 - 数据治理中心 DataArts Studio

配置互斥通过配置互斥组，可以避免多个作业去并发的运行。配置好互斥组以后，本次设置将在作业的下一个调度周期生效。互斥组配置完成后，在同一个互斥组内的作业，只能有一个作业是运行中，其他作业生成实例后则处于等待运行中。当运行中的作业运行完（包括执行成功、执行失败、取消）或者停止调度

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
配置环境变量 - 数据治理中心 DataArts Studio

变量是指不同的空间下取值不同，需要重新配置值，比如“工作空间名称”变量，这个值在不同的空间下配置不一样，导出导入后需要重新进行配置。常量是指在不同的空间下都是一样的，导入的时候，不需要重新配置值。图2 环境变量配置表1 环境变量参数配置参数是否必选说明参数名称是只支持英

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 配置管理 > 配置
配置管理 - 数据治理中心 DataArts Studio

配置管理配置管理资源父主题：数据开发

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发
管理配置中心 - 数据治理中心 DataArts Studio

数据库中的表，但能否更新成功是由底层数仓引擎的支持情况决定的。由于不同类型的数仓支持的更新表的能力不同，在数据架构中所做的表更新操作，如果数仓不支持，则无法确保数据库中的表和数据架构中的表是一致的。例如，DLI类型的表更新操作不支持删除表字段，如果在数据架构的表中删除了表字段，则无法在数据库中相应的删除表字段。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 通用操作
配置DWS源端参数 - 数据治理中心 DataArts Studio

抽取数据的模式或表空间名称。单击输入框后面的按钮可进入模式选择界面，用户也可以直接输入模式或表空间名称。如果选择界面没有待选择的模式或表空间，请确认对应连接里的账号是否有元数据查询的权限。说明：该参数支持配置通配符（*），实现导出以某一前缀开头或者以某一后缀结尾的所有数据库。例如：

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
配置Hive源端参数 - 数据治理中心 DataArts Studio

”后显示此参数。填写该参数表示指定抽取的WHERE子句，不指定则抽取整表。如果要迁移的表中没有WHERE子句的字段，则会迁移失败。该参数支持配置为时间宏变量，实现抽取指定日期的数据，详细说明请参见关系数据库增量迁移。说明：如果配置了时间宏变量，通过DataArts Stu

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数
Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

消费Kafka时每次fetch请求返回的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置数据服务审核中心 - 数据治理中心 DataArts Studio

配置数据服务审核中心数据服务平台的审核中心，提供给API开放方和API调用方用以审核API的发布等操作。在发布API时，会触发审核，审核机制如下：当发布人不具备审核人权限时，发布API时需要提交给审核人审核。当发布人具备审核人权限时，可无需审批直接发布API。待审核的API可在审核中心由发起者执行撤销操作。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务
DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

消费Kafka时每次fetch请求返回的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。 properties.max.partition.fetch.bytes int 1048576 消费Kafka时服务器将返回的每个分区的最大字节数。Kafka单条消息大的场景，可以适当调高每次获取的数据量，以提高性能。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置元数据采集任务 - 数据治理中心 DataArts Studio

适用于数据量较多的情况。基于全量数据，随机取x%的数据基于已采集的全量数据在数据目录中生成数据概要。适用于数据量较多的情况。 DLI队列选择获取profile数据，执行DLI SQL用的队列。勾选“采集唯一值”表示只统计已采集的表中的唯一值的个数，并在数据目录中的概要页签呈现。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
配置数据血缘 - 数据治理中心 DataArts Studio

Spark节点的“血缘关系”页签，手动配置血缘的输入表。假如MRS Spark作业中的输入表为“hive”，则血缘输入配置如图3所示。图3 配置血缘输入完成血缘的输入表配置后，单击确定，继续配置血缘的输出表。假如MRS Spark作业中的输出表为“a”，则血缘输出配置如图4所示。图4 配置血缘输出完

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 数据目录典型场景教程 > 通过数据目录查看数据血缘关系
配置DLI源端参数 - 数据治理中心 DataArts Studio

配置DLI源端参数作业中源连接为DLI连接时，源端作业参数如表1所示。表1 DLI作为源端时的作业参数参数名说明取值样例资源队列选择目的表所属的资源队列。 DLI的default队列无法在迁移作业中使用，您需要在DLI中新建SQL队列。 cdm 数据库名称写入数据的数据库名称。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业 > 配置CDM作业源端参数

总条数： 1326

上一页
1
2
3
4
5
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置节点并发数 - 数据治理中心 DataArts Studio

配置任务组 - 数据治理中心 DataArts Studio

CDM作业配置管理 - 数据治理中心 DataArts Studio

CDM不同集群规格对应并发的作业数是多少？ - 数据治理中心 DataArts Studio

CDM迁移作业的抽取并发数应该如何设置？ - 数据治理中心 DataArts Studio

配置 - 数据治理中心 DataArts Studio

数据服务配置数据搬迁 - 数据治理中心 DataArts Studio

主机连接参数说明 - 数据治理中心 DataArts Studio

配置互斥 - 数据治理中心 DataArts Studio

配置环境变量 - 数据治理中心 DataArts Studio

配置管理 - 数据治理中心 DataArts Studio

管理配置中心 - 数据治理中心 DataArts Studio

配置DWS源端参数 - 数据治理中心 DataArts Studio

配置Hive源端参数 - 数据治理中心 DataArts Studio

Apache Kafka到MRS Kafka参数调优 - 数据治理中心 DataArts Studio

配置数据服务审核中心 - 数据治理中心 DataArts Studio

DMS Kafka到OBS参数调优 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

配置数据血缘 - 数据治理中心 DataArts Studio

配置DLI源端参数 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线