搜索_华为云

部署推理服务 - AI开发平台ModelArts

填写ascend_vllm文件夹绝对路径。高阶配置（可选）。词表切分。在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量： export USE_VOCAB_PARALLEL=1 #打开词表切分开关

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
不启用自动停止，系统会自动停掉Notebook实例吗？会删除Notebook实例吗？ - AI开发平台ModelArts

不启用自动停止，系统会自动停掉Notebook实例吗？会删除Notebook实例吗？针对此问题，需要根据选择的不同资源规格进行说明。如果使用免费规格，Notebook实例将在运行1小时后，自动停止。如果72小时内没有再次启动，会释放资源，即删除此Notebook实例。因此使用免费规格时，关注运行时间并注意文件备份。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
查询节点列表 - AI开发平台ModelArts

creationTimestamp String 创建时间。表7 NodeSpec 参数参数类型描述 flavor String 节点规格。表8 NodeStatus 参数参数类型描述 phase String 节点当前状态。可选值如下： Available：节点可用 Creating：节点创建中

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

DeepSpeed的核心思想是在单个GPU上实现大规模模型并行训练，从而提高训练速度。DeepSpeed提供了一系列的优化技术，如ZeRO内存优化、分布式训练等，可以帮助用户更好地利用多个GPU进行训练 Accelerate是一种深度学习加速框架，主要针对分布式训练场景。Acce

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

启动入口文件run.sh需要自定义。示例如下： #!/bin/bash # 自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建AI应用时填写与您镜像中相同的启动命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

集）。输出路径：选择步骤2的3中的数据集输出位置。训练规格：根据您的实际需要选择对应的训练规格。确认无误后单击右下角“创建项目”可自动跳转至自动学习的运行总览页面。步骤四：运行工作流在自动学习的运行总览页面，会产生一条工作流。工作流会自动从数据标注节点开始，依次运行数据

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

服务调用中步骤4正常推理即可，由于图模式编译过程耗时久，请耐心等待。SD1.5预估编译约10分钟，SDXL预估编译约30分钟。图模式编译过程会固定图尺寸，因此不同尺寸都需要进行一次编译，切换模型会重新进行编译。父主题： AIGC模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

识别服务”为例。 “资源池”：选择“公共资源池”。 “AI应用来源”和“选择AI应用及版本”：会自动选择订阅模型。 “计算节点规格”：在下拉框中选择“限时免费”资源，勾选并阅读免费规格说明。其他参数可使用默认值。如果限时免费资源售罄，建议选择收费CPU资源进行部署。当选择收费

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
ModelArts预置镜像更新说明 - AI开发平台ModelArts

ModelArts预置镜像更新说明本章节提供了ModelArts预置镜像的变更说明，比如依赖包的变化，方便用户感知镜像能力的差异，减少镜像使用问题。统一镜像更新说明表1 统一镜像更新说明镜像名称更新时间更新说明 mindspore_2.3.0-cann_8.0.rc1-py_3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
JupyterLab常用功能介绍 - AI开发平台ModelArts

$PYTHONPATH 图10 运行代码自动停止及续期在创建或启动Notebook时，如果启用了自动停止功能，则在JupyterLab的右上角会显示当前实例停止的剩余时长，在计时结束前可以单击剩余时间进行续期。图11 自动停止图12 续期 JupyterLab常用快捷键和插件栏图13

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

比如防火墙配置是2小时空闲就关闭连接，那我们客户端配置ServerAliveInterval小于2小时（比如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改，写在这里仅是帮助理解ssh配置原理）配

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

比如防火墙配置是2小时空闲就关闭连接，那客户端配置ServerAliveInterval小于2小时（比如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改，写在这里仅是帮助理解ssh配置原理）配

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Administrator 裸金属服务器BMS BMS FullAccess 镜像服务IMS IMS FullAccess 数据加密服务DEW DEW KeypairReadOnlyAccess 虚拟私有云VPC VPC FullAccess 弹性云服务器ECS ECS FullAccess

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

# 推理工具代码上传至SFS Turbo 将AscendSpeed代码包AscendCloud-LLM-xxx.zip直接上传至ECS服务器中的SFS Turbo中，例如存放在/mnt/sfs_turbo/AscendCloud-LLM-xxx.zip目录下并解压缩。 unzip

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
昇腾迁移快速入门案例 - AI开发平台ModelArts

0-cann_7.0.1-py_3.9-euler_2.10.7-aarch64-snt9b”。类型：Ascend。规格：选择snt9b资源。存储配置：云硬盘EVS。磁盘规格：按照对应的存储使用情况可选择存储大小。 SSH远程开发：如果需通过VS Code远程连接Notebook实例

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

解等特点。本文档主要介绍如何利用训练框架PyTorch_npu + 华为自研Ascend Snt9B硬件，完成Qwen-VL推理。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。表1 环境要求名称版本 PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理

总条数： 748

上一页
1
...
17
18
19
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

不启用自动停止，系统会自动停掉Notebook实例吗？会删除Notebook实例吗？ - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建AI应用 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

ModelArts预置镜像更新说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

昇腾迁移快速入门案例 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线