搜索_华为云

创建团队标注验收任务 - AI开发平台ModelArts

是否必选参数类型描述 sampling_num 否 Integer 验收任务的抽样数目，与抽样比例二选一。 sampling_rate 否 Double 验收任务的抽样比例，取值范围为(0,1]，与抽样数目二选一。响应参数状态码： 200 表3 响应Body参数参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
专属资源池训练 - AI开发平台ModelArts

专属资源池训练资源选择推荐步骤总览资源购买基本配置调试与训练 FAQ 父主题：历史待下线案例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
服务启动失败 - AI开发平台ModelArts

容。镜像中配置的端口错误模型可以正常启动，但是因为镜像中启用的端口非8080，或者镜像启用的端口与创建模型时配置的端口不一致，导致部署服务时register-agent无法与模型通信，超过一定时间后（最长20分钟）认为模型启动失败。需要检查两个地方：自定义镜像中的代码开放的

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练脚本参数说明不同模型推荐的参数与NPU卡数设置训练tokenizer文件说明父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
Ascend相关问题 - AI开发平台ModelArts

Ascend相关问题 Cann软件与Ascend驱动版本不匹配训练作业的日志出现detect failed（昇腾预检失败）父主题：训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

DEVICES=‘1’这种类似固定的卡ID号，与实际选择的卡ID不匹配。处理方法尽量代码里不要去修改CUDA_VISIBLE_DEVICES变量，用系统默认里面自带的。如果必须指定卡ID，需要注意1/2/4规格下，指定的卡ID与实际分配的卡ID不匹配的情况。如果上述方法还

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
投机推理使用说明 - AI开发平台ModelArts

小模型投机步数，即小模型生成几个token来交给大模型进行推理，取值通常在2~6之间，步数越小，每次校验的token越少，投机token与大模型一致的概率越高；反之，步数过大会导致与大模型无法保持一致，造成资源浪费。 offline speculative_draft_tensor_parallel_size

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
修改工作空间 - AI开发平台ModelArts

是否必选参数类型描述 user_id 否 String IAM用户ID。此参数与user_name必填一个。两者都填优先使用user_id。 user_name 否 String IAM用户名称。此参数与user_id必填一个。响应参数状态码： 200 表5 响应Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

从而通过身份认证。 AK(Access Key ID)：访问密钥ID。与私有访问密钥关联的唯一标识符；访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。 SK(Secret Access Key)：与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
训练脚本说明 - AI开发平台ModelArts

训练脚本说明训练脚本存放目录说明不同模型推荐的参数与NPU卡数设置训练tokenizer文件说明父主题： Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
断点续训和故障快恢说明 - AI开发平台ModelArts

启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持一致，不一致则修改latest_checkpointed_iteration.txt内容与iter_000xxxx保持一致。 |──${saved_checkpoints}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
断点续训和故障快恢说明 - AI开发平台ModelArts

启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持一致，不一致则修改latest_checkpointed_iteration.txt内容与iter_000xxxx保持一致。 |──${saved_checkpoints}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
Lite Cluster - AI开发平台ModelArts
Lite Cluster - AI开发平台ModelArts

Lite Cluster 资源池创建失败的原因与解决方法？ Cluster资源池节点故障如何定位特权池信息数据显示均为0%如何解决？重置节点后无法正常使用？

帮助中心 > AI开发平台ModelArts > 故障排除
断点续训和故障快恢说明 - AI开发平台ModelArts

启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持一致，不一致则修改latest_checkpointed_iteration.txt内容与iter_000xxxx保持一致。 |──${saved_checkpoints}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
在Notebook中使用Moxing命令 - AI开发平台ModelArts

在Notebook中使用Moxing命令 MoXing Framework功能介绍 Notebook中快速使用MoXing mox.file与本地接口的对应关系和切换 MoXing常用操作的样例代码 MoXing进阶用法的样例代码父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
断点续训和故障快恢说明 - AI开发平台ModelArts

启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持一致，不一致则修改latest_checkpointed_iteration.txt内容与iter_000xxxx保持一致。 |──${saved_checkpoints}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导基于advisor的昇腾训练性能自助调优指导 Dit模型Pytorch迁移与精度性能调优 msprobe工具使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践
创建训练作业 - AI开发平台ModelArts

但不可与data_url同时出现。 dataset_version 否 String 训练作业的数据集版本ID。应与dataset_id同时出现，但不可与data_url同时出现。 type 否 String 数据集类型。可选值：“obs”、“dataset”。obs与dataset不可同时出现。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Standard专属资源池 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？ ModelArts训练专属资源池如何与SFS弹性文件系统配置对等链接？

帮助中心 > AI开发平台ModelArts > 常见问题
创建工作空间 - AI开发平台ModelArts

是否必选参数类型描述 user_id 否 String IAM用户ID。此参数与user_name必填一个。两者都填优先使用user_id。 user_name 否 String IAM用户名称。此参数与user_id必填一个。响应参数状态码： 200 表5 响应Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理

总条数： 873

上一页
1
...
23
24
25
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建团队标注验收任务 - AI开发平台ModelArts

专属资源池训练 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

Ascend相关问题 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

训练脚本说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

Lite Cluster - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

在Notebook中使用Moxing命令 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

GPU业务迁移至昇腾训练推理 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线