搜索_华为云

推理场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.906版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9B资源。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。支持FP16和BF16数据类型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
推理场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.907版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9B资源。推理部署使用的服务框架是vLLM。vLLM支持v0.5.0版本。支持FP16和BF16数据类型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
调用MaaS部署的模型服务 - AI开发平台ModelArts

常见错误码错误码错误内容说明 400 Bad Request 请求包含语法错误。 403 Forbidden 服务器拒绝执行。 404 Not Found 服务器找不到请求的网页。 500 Internal Server Error 服务内部错误。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Notebook提示磁盘空间已满 - AI开发平台ModelArts

用内存，导致磁盘空间不足。磁盘配额不足。处理方法查看虚拟机所使用的存储空间，再查看回收站文件占用内存，根据实际删除回收站里不需要的大文件。在Notebook实例详情页，查看实例的存储容量。执行如下命令，排查虚拟机所使用的存储空间，一般接近存储容量，请排查回收站占用内存。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理工具代码上传至SFS Turbo 将AscendSpeed代码包AscendCloud-LLM-xxx.zip直接上传至ECS服务器中的SFS Turbo中，例如存放在/mnt/sfs_turbo/AscendCloud-LLM-xxx.zip目录下并解压缩。 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
Notebook中构建新镜像 - AI开发平台ModelArts

Notebook中构建新镜像 ModelArts中注册镜像通过ECS获取和上传基础镜像将基础镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。访问ModelArts，在镜像管理中选择注册镜像，如图所示：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
ma-cli configure鉴权命令 - AI开发平台ModelArts

ma-cli configure鉴权命令鉴权信息说明在虚拟机及个人PC场景，需要配置鉴权信息，目前支持用户名密码鉴权（默认）和AK/SK鉴权；在使用账号认证时，需要指定username和password；在使用IAM用户认证时，需要指定account、username和password；

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
Standard资源管理 - AI开发平台ModelArts

Native的资源、任务等能力，用户可以直接操作资源池中的节点和k8s集群。请参见弹性集群k8s Cluster。弹性裸金属：弹性裸金属提供不同型号的xPU裸金属服务器，您可以通过弹性公网IP进行访问，在给定的操作系统镜像上可以自行安装GPU&NPU相关的驱动和其他软件，使用SFS或OBS进行数据存储和读

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
推理场景介绍 - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.908版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。资源规格推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9B资源。推理部署使用的服务框架是vLLM。vLLM支持v0.5.0版本。支持FP16和BF16数据类型推理。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

启动入口文件run.sh需要自定义。示例如下： #!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建AI应用时填写与您镜像中相同的启动命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
自定义引擎创建模型规范 - AI开发平台ModelArts

启动入口文件run.sh需要自定义。示例如下： #!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 提供的服务必须使用https协议，且暴露在“8080”端口。请参考https示例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
查询作业资源规格 - AI开发平台ModelArts

调用失败时的错误码，具体请参见错误码。调用成功时无此字段。 spec_total_count Integer 作业资源规格总数。 specs specs结构数组资源规格参数列表，如表4所示。表4 specs属性列表说明参数参数类型说明 spec_id Long 资源规格的ID。 core String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口
基本概念 - AI开发平台ModelArts
基本概念 - AI开发平台ModelArts

特定子项目中资源，使得资源的权限控制更加精确。同样在我的凭证下，您可以查看项目ID。图1 项目隔离模型企业项目企业项目是项目的升级版，针对企业不同项目间资源的分组和管理，是逻辑隔离。企业项目中可以包含多个区域的资源，且项目中的资源可以迁入迁出。关于企业项目ID的获取及企

 帮助中心 > AI开发平台ModelArts > API参考 > 使用前必读
从AI Gallery订阅模型 - AI开发平台ModelArts

从AI Gallery订阅模型在AI Gallery中，支持订阅官方发布或者他人分享的模型，订阅后的模型，可推送至ModelArts模型管理中，进行统一管理。订阅应用模型与云服务订阅AI应用的区别：在管理控制台，模型管理所在位置不同。订阅应用统一管理在“AI应用>订阅应用”

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用 > 订阅模型
从AI Gallery订阅模型 - AI开发平台ModelArts

从AI Gallery订阅模型在AI Gallery中，支持订阅官方发布或者他人分享的模型，订阅后的模型，可推送至ModelArts模型管理中，进行统一管理。订阅应用模型与云服务订阅AI应用的区别：在管理控制台，模型管理所在位置不同。订阅应用统一管理在“AI应用>订阅应用”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用
Lite Cluster高危操作一览表 - AI开发平台ModelArts

Lite Cluster高危操作一览表当您在CCE、ECS或BMS服务控制台直接操作ModelArts Lite Lite Cluster资源时，可能会导致资源池部分功能异常。下表可帮助您定位异常出现的原因，风险操作包括但不限于以下内容。高危操作风险等级说明：高：对于可能直

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

2之间（包含2019.2和2023.2）版本，包括社区版和专业版。使用PyCharm ToolKit远程连接Notebook开发环境，仅限PyCharm专业版。使用PyCharm ToolKit提交训练作业，社区版和专业版都支持，PyCharm ToolKit latest版本仅限提交新版训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
推理精度测试 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保Notebook内通网，已通网可以跳过这一步，未通网需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字确保容器内通网，未通网需要配置$config_proxy_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例仅支持在专属资源池上运行。文档更新内容 6.3.908版本相对于6.3.907版本新增如下内容：文档和代码中新增对mistral和mixtral模型的适配，并添加训练推荐配置。文档准备镜像步骤中，仅提供：直接使用基础镜像方案、ECS中构建新镜像方案，删除使用Notebook创建镜像方案。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）

总条数： 761

上一页
1
...
10
11
12
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

Notebook提示磁盘空间已满 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

ma-cli configure鉴权命令 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

查询作业资源规格 - AI开发平台ModelArts

基本概念 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线