搜索_华为云

管理Notebook实例 - AI开发平台ModelArts

管理Notebook实例查找Notebook实例更新Notebook实例启动/停止/删除实例保存Notebook实例动态扩充云硬盘EVS容量动态挂载OBS并行文件系统查看Notebook实例事件 Notebook Cache盘告警上报父主题：使用Notebook进行AI开发调试

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
删除工作空间 - AI开发平台ModelArts

是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workspace_id 是 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表2 请求Header参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）场景介绍准备工作指令监督微调训练任务查看日志和性能训练脚本说明附录：指令微调训练常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

置kubectl。图3 kubectl访问集群配置在节点机器中，输入命令，查看Kubernetes集群信息。如果显示如图4的内容，则配置成功。 kubectl cluster-info 图4 查看Kubernetes集群信息正确弹出内容父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
获取某个超参敏感度分析图像的路径 - AI开发平台ModelArts

是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 file_path String 超参敏感度分析图像的保存路径。请求示例如下查询training_job_id为e34620

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

elLink PyTorch NPU训练指导（6.3.907）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

Cluster适配PyTorch NPU训练指导（6.3.910）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

Cluster适配PyTorch NPU训练指导（6.3.909）场景介绍准备工作预训练任务 SFT全参微调训练任务 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

基于ModelArts Standard一键完成商超商品识别模型部署 - 在线服务物体检测此案例以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。第三方推理框架迁移到ModelArts Standard推理自定义引擎

 帮助中心 > AI开发平台ModelArts > 最佳实践
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）场景介绍准备工作预训练 SFT全参微调训练 LoRA微调训练查看日志和性能训练脚本说明常见错误原因和解决方法父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

开始测试使用的最小数据：取值范围[1, 1024]，单位可选为“B”、“KB”、“MB”、“GB”“TB”。日志上传路径：AI诊断日志上传路径。数据增加方式：当前支持乘法方式。乘法系数：数值范围[2, 100]。超过时间：数值范围[150, 3600]。 NCCL Test节点名称列表：不可为空，且被选择的节点须为可用状态。

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Cluster
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

写模型的入参，和在线服务的输入参数对应，比如本例中预测图片的参数为“images”。然后在“VALUE”值，选择文件，上传一张待预测图片（当前仅支持单张图片预测），如图4所示。图4 填写Body 文本输入选择“raw”，选择JSON(application/json)类型，在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
使用SmoothQuant量化 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，若希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果执行权重转换。 cd autosmoothquant/examples/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图1 查询结果执行权重转换。 cd autosmoothquant/examples/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可纠正ECC错误（单比特ECC错误），不影响业务。观测方式：nvidia-smi -a中查询到Volatile Correctable记录。 L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。 L3:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster

总条数： 1609

上一页
1
...
58
59
60
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理Notebook实例 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

删除工作空间 - AI开发平台ModelArts

主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

获取某个超参敏感度分析图像的路径 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） - AI开发平台ModelArts

主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） - AI开发平台ModelArts

Cluster资源池如何进行NCCl Test？ - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线