搜索_华为云

性能调优 - 数据治理中心 DataArts Studio

如果大量CDM作业同时执行，当超过当前CDM集群的并发执行作业数时，会导致作业排队，耗时提升。建议您将迁移作业的运行时间错开，平摊在业务周期内，避免资源紧张导致迁移时间过长。调整抽取并发数对于低任务量场景，调整抽取并发数是性能调优的最佳方式。CDM迁移作业支持设置作业抽取并发数，同时也可以设置集群最大抽取并发数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 优化迁移性能
MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

单线程flush的FileGroup的数量 <= 5，推荐值2。单线程flush的FileGroup的数量 <= 10，推荐值5。单线程flush的FileGroup的数量 <= 25，推荐值10。单线程flush的FileGroup的数量 <= 50，推荐值20。单线程flush的FileGroup的数量

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 任务性能调优
配置元数据采集任务 - 数据治理中心 DataArts Studio

择该数据连接下的所有数据库（或数据库和schema、命名空间）。单击数据表后的“设置”，设置采集任务扫描的数据表范围。当不进行设置时，默认选择数据库（或数据库和schema、命名空间）下的所有数据表。当数据库（或数据库和schema、命名空间）和数据表均不设置时，则采集任务扫

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据目录 > 采集数据源的元数据
新建表/文件迁移作业 - 数据治理中心 DataArts Studio

/user/dirtydir 单个分片的最大错误记录数当“是否写入脏数据”为“是”才显示该参数。单个map的错误记录超过设置的最大错误记录数则任务自动结束，已经导入的数据不支持回退。推荐使用临时表作为导入的目标表，待导入成功后再改名或合并到最终数据表。 0 开启限速设置限速可以保护源端读取压

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建作业
MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

数据库的连接地址、端口。数据库名称：配置为RDS上MySQL数据库的名称。用户名、密码：登录数据库的用户和密码。创建RDS连接时，“使用本地API”设置为“是”时，可以使用MySQL的LOAD DATA功能加快数据导入，提高导入数据到MySQL的性能。由于RDS上的MySQL默认没有开启LOAD

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
配置作业调度为年调度 - 数据治理中心 DataArts Studio

场景描述在配置作业配置调度时，可以选择一年中的某个时间进行调度。如果您需要配置作业的调度时间为年调度，请参考下面的方法进行配置。配置方法在DataArts Studio中配置一个按月调度执行的作业，然后在作业里面新增一个Dummy节点（空节点，不处理实际的业务数据），在Dummy

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
调用API方式简介 - 数据治理中心 DataArts Studio

创建API时，有三种认证方式可选，不同认证方式的API支持的调用方式也有所不同，详见表1。表1 API认证与调用方式说明认证方式安全级别授权与认证机制支持的调用方式调用方法示例使用说明（推荐）APP认证高通过APP应用将API授权给应用后，使用应用的密钥对（A

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 调用数据服务API > 通过不同方式调用API
新建维度 - 数据治理中心 DataArts Studio

普通维度：不具有层级结构的维度。码表维度：基于码表创建的维度，其字段信息、数据与码表保持一致，表示内容是可枚举的维度。层级维度：属性之间具有层级结构的维度。高级配置设置自定义项，以对表进行描述。自定义项设置完成后仅可用于在表详情中进行查看，无特殊需求时无需设置。例如您需要标识该表的来源时

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
新建事实表 - 数据治理中心 DataArts Studio

*资产责任人根据下拉框选择对应的资产责任人，可以手动输入名字或直接选择已有的责任人。高级配置设置自定义项，以对表进行描述。自定义项设置完成后仅可用于在表详情中进行查看，无特殊需求时无需设置。例如您需要标识该表的来源时，可以设置自定义项配置名为“来源”，值为对应的表来源信息。配置完成后可以在表详情中查看该信息。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据架构 > 模型设计 > 维度建模
实例监控 - 数据治理中心 DataArts Studio

实例监控”。在作业所在的“操作”列，单击“重跑”设置重跑当前作业实例；或单击作业名称左边的复选框，再选择页面上方的“重跑”按钮可以批量设置多个作业的实例重跑。图1 设置单个作业重跑图2 批量设置作业重跑批量设置多个作业实例重跑时，仅需要配置重跑开始位置、使用的作业参数、是否忽略OBS监听等参数。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 运维调度
配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

schema：该参数会显示在写入的数据的消息体中，此处配置该参数时后续显示为设置的参数；如果没有配置，默认使用原表的schema值。 table：该参数会显示在写入的数据的消息体中，此处配置该参数时后续显示为设置的参数；如果没有配置，默认使用源端的表名。 acks：取值0，1、all。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
Open/Close Resource - 数据治理中心 DataArts Studio

挂起当前作业执行计划：当前作业实例的状态为运行异常，该节点的后续节点以及依赖于当前作业的后续作业实例都会处于等待运行状态。是否空跑否如果勾选了空跑，该节点不会实际执行，将直接返回成功。任务组否选择任务组。任务组配置好后，可以更细粒度的进行当前任务组中的作业节点的并发数控制，比如作业中包含多个节点、补数据、重跑等场景。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
CloudTable连接参数说明 - 数据治理中心 DataArts Studio

认证”，该参数需设置为“是”，否则设置为“否”。当选择IAM统一身份认证时，需要输入用户名、AK和SK。否用户名登录CloudTable集群的用户名。 admin AK 登录CloudTable集群的访问标识。您需要先创建当前账号的访问密钥，并获得对应的AK和SK。 -

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 在CDM集群中创建连接 > 配置连接参数
MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

Manager的IP地址，可以单击输入框后的“选择”来选定已创建的MRS集群，CDM会自动填充下面的鉴权参数。用户名：选择KERBEROS鉴权时，需要配置MRS Manager的用户名和密码。从HDFS导出目录时，如果需要创建快照，这里配置的用户需要HDFS系统的管理员权限。密码：访问MRS

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（CDM作业） > 使用教程
MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

WS数据库中建出相应的表。图7 源表与目标表映射目标字段赋值：单击操作列“目标字段赋值”可自定义MongoDB到DWS的字段映射情况。同时用户可以为所有DWS目标端的字段，设置对应的源表映射字段，或者设置手动赋值的字符串内容。列名：目的端DWS表字段的名称。类型：目的端DWS表字段的类型。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（实时作业） > 使用教程
跨空间进行作业调度 - 数据治理中心 DataArts Studio

该IF判断条件表示，仅当从Kafka通道获取的消息逗号后的部分为“21”时，即每月21日时，才执行后续的作业节点。如果您需要匹配多条消息记录，可以添加多个Dummy节点并分别添加到Subjob节点的IF条件，然后将数据开发组件配置项中的“多IF策略”设置为“逻辑或”即可。图9 编辑参数表达式

 帮助中心 > 数据治理中心 DataArts Studio > 最佳实践 > 数据开发进阶实践
配置入口API算子 - 数据治理中心 DataArts Studio

实际配置中，需要根据所设计的调用API工作流时请求参数情况来设置入参。例如，设计工作流在多张表中根据用户ID查询用户信息时，请求Path设置为：/getUserInfo。可按照如下不同场景来配置入参： API调用时请求参数为用户id，需要通过工作流返回对应id的用户信息。单击“添加”，参数名配置为id。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据服务 > 开发数据服务API > 编排API
DLI Spark - 数据治理中心 DataArts Studio

选定DLI队列后，下拉可选择作业使用Spark组件的版本号，使用时如无特定版本要求时使用默认版本号2.3.2，有特殊使用要求时选择对应的版本即可。作业特性否作业使用的Spark镜像类型，当前支持基础型、AI增强型和自定义的Spark镜像。自定义镜像需要选择自定义镜像名称和

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

技术资产数量增量包：不同版本的DataArts Studio实例，提供了不同的技术资产数量规格限制。该规格是以数据目录中表和OBS文件的数量计算的，您可以在新商业模式的DataArts Studio实例卡片上通过“更多 > 配额使用量”查看使用量。当您的技术资产数量接近或达到该规格时，建议购买技术资产数量增量包，以避免资产采集受限。

帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例
DWS SQL - 数据治理中心 DataArts Studio

数据连接是默认选择SQL脚本中设置的数据连接，支持修改。数据库是默认选择SQL脚本中设置的数据库，支持修改。脚本参数否关联的SQL脚本如果使用了参数，此处显示参数名称，请在参数名称后的输入框配置参数值。参数值支持使用EL表达式。若关联的SQL脚本，脚本参数发生变化，可单击刷新按钮同步。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 节点参考

总条数： 1192

上一页
1
...
7
8
9
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优 - 数据治理中心 DataArts Studio

MySQL到MRS Hudi参数调优 - 数据治理中心 DataArts Studio

配置元数据采集任务 - 数据治理中心 DataArts Studio

新建表/文件迁移作业 - 数据治理中心 DataArts Studio

MySQL整库迁移到RDS服务 - 数据治理中心 DataArts Studio

配置作业调度为年调度 - 数据治理中心 DataArts Studio

调用API方式简介 - 数据治理中心 DataArts Studio

新建维度 - 数据治理中心 DataArts Studio

新建事实表 - 数据治理中心 DataArts Studio

实例监控 - 数据治理中心 DataArts Studio

配置MRS Kafka目的端参数 - 数据治理中心 DataArts Studio

Open/Close Resource - 数据治理中心 DataArts Studio

CloudTable连接参数说明 - 数据治理中心 DataArts Studio

MRS HDFS数据迁移到OBS - 数据治理中心 DataArts Studio

MongoDB同步到DWS作业配置 - 数据治理中心 DataArts Studio

跨空间进行作业调度 - 数据治理中心 DataArts Studio

配置入口API算子 - 数据治理中心 DataArts Studio

DLI Spark - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

DWS SQL - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线