搜索_华为云

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

ptdbg_ascend 精度整网对比工具，可以对NPU整网数据进行dump并与GPU dump数据进行比较，输出整网的精度情况的诊断和分析。支持模块级dump，可按模块级别做对比。支持溢出检测功能，可检测API的溢出情况。支持梯度监控功能，可辅助定位长训精度问题。下载工具whl包安装使用，推荐使用最新版本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
创建资源池 - AI开发平台ModelArts

String 资源规格，比如：modelarts.vm.gpu.tnt004。 count 是 Integer 资源规格的保障资源量。 maxCount 否 Integer 资源规格的弹性资源量。物理池中该值和count必须一致。 extendParams 否 extendParams object

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询开发环境实例列表 - AI开发平台ModelArts

专属资源池ID。查询该专属资源池下的所有实例信息。请求消息无。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 total_count Integer 总的开发环境数量。 instances Array 配置列表，如表4所示。表4 instances字段响应参数说明参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查询处理任务列表 - AI开发平台ModelArts

存在创建并使用的工作空间，以实际取值为准。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 count Integer 数据处理任务总数。 tasks Array of DescribeProcessorTaskResp objects 分页查询到的数据处理任务列表。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用ModelArts Standard训练模型 - AI开发平台ModelArts

准备模型训练代码准备模型训练镜像创建调试训练作业创建算法创建生产训练作业增量模型训练分布式模型训练模型训练存储加速自动模型优化（AutoSearch）模型训练高可靠性管理模型训练作业

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
查看授权列表 - AI开发平台ModelArts

Integer 分页列表的起始页，默认为0。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 total_count Number 授权信息总数。 auth Array of AuthorizationResponse objects 授权信息列表。表4

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
获取支持的超参搜索算法 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 search_algo_count Integer 超参搜索算法的个数。 search_algo_list Array of search_algo_list objects

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
什么是Workflow - AI开发平台ModelArts

估等，让AI项目管理者能很方便的查看流水线执行过程的质量与效率。流程优化：围绕流水线每一次迭代，用户可以自定义输出相关的核心指标，并获取相应的问题数据与原因等，从而基于这些指标，快速决定下一轮迭代的执行优化。 Workflow介绍 Workflow（也称工作流，下文中均可使用工

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
查询数据处理任务版本的结果展示 - AI开发平台ModelArts

-1：全部 0：保留 1：修改 2：删除 3：新增请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 count Integer 结果总数。 has_more Boolean 是否已返回全部结果。 results Array of DescProc

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

'torch_npu._C._NPUDeviceProperties' object has no attribute 'multi_processor_count' deepspeed多卡训练报错TypeError: deepspeed_init() got an unexpected keyword

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

SDK版本说明表1 ModelArts SDK版本说明发布时间版本号说明 2023-04 1.4.18 1.4.18版本在SDK旧版本基础上优化集成，主要新增DLI Spark任务提交能力，支持服务部署到推理新版专属资源池。支持的区域当前支持的“region_name”包括华北

 帮助中心 > AI开发平台ModelArts > SDK参考
如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

如何使用pandas库处理OBS桶中的数据？参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题：数据存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
AI Gallery简介 - AI开发平台ModelArts

Gallery简介 AI Gallery算法、镜像、模型、Workflow等AI数字资产的共享，为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体，提供安全、开放的共享及交易环节，加速AI资产的开发与落地，保障AI开发生态链上各参与方高效地实现各自的商业价值。资产集市介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
Lite Server使用流程 - AI开发平台ModelArts

相关名词解释名词含义裸金属服务器裸金属服务器是一款兼具虚拟机弹性和物理机性能的计算类服务，为您和您的企业提供专属的云上物理服务器，为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。由于Server是一台裸金属服务器，在ModelArts管理控制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
成本管理 - AI开发平台ModelArts
成本管理 - AI开发平台ModelArts

ModelArts支持企业项目管理，可以由企业项目服务来管理同一账号下不同项目的成本。成本分析通过华为云费用账单来分析账号下的成本支出情况。成本优化长期使用的资源，建议客户使用更优惠的方式购买（包年包月）；针对临时使用的资源，您可选择按需的资源规格，避免浪费。

帮助中心 > AI开发平台ModelArts > 计费说明
查询作业资源规格 - AI开发平台ModelArts

调用成功时无此字段。 error_code String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 spec_total_count Integer 作业资源规格总数。 specs specs结构数组资源规格参数列表，如表4所示。表4 specs属性列表说明参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
AI CPU 算子替换样例 - AI开发平台ModelArts

AICPU上。图7 替换前耗时替换后，总体耗时226.131us。下发三个执行算子，均执行在AI CORE上。图8 替换后耗时 ArgMin算子优化 ArgMin在CANN 6.3 RC2版本上算子下发到 AICPU执行，在CANN 7.0RC1上下发到AI_CORE 上边执行。出现此类情形建议升级CANN包版本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优 > 自动诊断工具MA-Advisor使用指导
SFT全参微调训练 - AI开发平台ModelArts

断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）

总条数： 359

上一页
1
...
8
9
10
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

使用ModelArts Standard训练模型 - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

获取支持的超参搜索算法 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

查询数据处理任务版本的结果展示 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

Lite Server使用流程 - AI开发平台ModelArts

成本管理 - AI开发平台ModelArts

查询作业资源规格 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

AI CPU 算子替换样例 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线