搜索_华为云

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

Shell功能登录训练作业worker-0实例，使用curl {sfs-turbo-endpoint}:{port}命令检查port是否正常打开，SFS Turbo所需要入方向的端口号为111、445、2049、2051、2052、20048，具体请参见创建文件系统的“安全组”参数。Cloud

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
在推理生产环境中部署推理服务 - AI开发平台ModelArts

其他参数可以根据实际情况进行配置，也可使用openai接口启动服务。推理启动脚本必须名为run_vllm.sh，不可修改其他名称。 hostname和port也必须分别是0.0.0.0和8080不可更改。 Step2 部署模型在ModelArts控制台的AI应用管理模块中，将模型部署为一个AI应用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

py --port 8443 --force-fp16 --listen --port 端口号与启动容器时映射到宿主机的端口号保持一致。发送服务请求。从浏览器访问ComfyUI服务。在浏览器中输入 http://{ip}:{port} 这里的ip为宿主机节点ip，port为启动ComfyUI使用的端口号。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

gpu_type 节点上GPU的型号。 device_name infiniband或RoCE网络网卡的设备名称。 port IB网卡的端口号。 physical_state IB网卡每个端口的状态。 firmware_version IB网卡的固件版本。 filesystem NFS挂载的文件系统。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
非分离部署推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
在推理生产环境中部署推理服务 - AI开发平台ModelArts

--tensor-parallel-size：并行卡数。 --hostname：服务部署的IP，使用本机IP 0.0.0.0。 --port：服务部署的端口8080。 --max-model-len：最大数据输入+输出长度，不能超过模型配置文件config.json里面定义的“max

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

“容器调用接口” 模型提供的推理接口所使用的协议和端口号，请根据模型实际定义的推理接口进行配置。 “镜像复制” 镜像复制开关，选择是否将容器镜像中的模型镜像复制到ModelArts中。关闭时，表示不复制模型镜像，可极速创建模型，更改或删除SWR源目录中的镜像会影响服务部署。开启

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

服务部署的IP，${docker_ip}替换为宿主机实际的IP地址。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。 --

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用PyCharm手动连接Notebook - AI开发平台ModelArts

模块获取的IP地址。例如：dev-modelarts-cnnorth4.huaweicloud.com Port：云上开发环境的端口，即在开发环境实例页面远程访问模块获取的端口号。 User name：固定为ma-user。 Authentication type：Key pair方式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
非分离部署推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Lite资源池，每个节点会以DaemonSet方式部署node-agent组件，该组件会检测节点状态，并将检测结果写到K8S NodeCondtition中。同时，节点故障指标默认会上报到AOM，您可在AOM配置告警通知。当发生节点异常时，在故障初步分析阶段，您可先按表1识别是否为亚健康并自助进行处理，如果不是，则

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
非分离部署推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
启动推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

${IdentityFile} ${User}@${HostName} -p ${Port} 参数说明： - IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号在VS Code中手工配置远程连接时，在本地的ssh c

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
PD分离性能调优工具使用说明 - AI开发平台ModelArts

0.1,127.0.0.1"表示4个实例的ip均为127.0.0.1，ip的个数需要与port端口个数相同 port 各个实例的端口，"8088,8089,8090,8091"分别表示4个实例的端口 request_num 总请求数量 model_path 模型权重路径 served_model_name

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
约束与限制 - AI开发平台ModelArts

计算资源套餐包套餐包仅用于公共资源池，不能用于专属资源池。配额限制查看每个配额项目支持的默认配额，请参考怎样查看我的配额？，登录控制台查询您的配额详情。表2 配额资源类型默认配额限制是否支持调整说明 Standard Notebook 一个账号最多创建10个Notebook。

帮助中心 > AI开发平台ModelArts > 产品介绍
非分离部署推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
启动推理服务 - AI开发平台ModelArts

ocker_ip}替换为宿主机实际的IP地址，默认为None，举例：参数可以设置为0.0.0.0。 --port：服务部署的端口。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remote-code：是否相信远程代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理服务部署
部署推理服务 - AI开发平台ModelArts

}替换为宿主机实际的IP地址。 --port：服务部署的端口，和Step4 启动容器镜像中设置的端口保持一致，否则不能在容器外访问推理服务。 --gpu-memory-utilization：NPU使用的显存比例，复用原vLLM的入参名称，默认为0.9。 --trust-remo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）

总条数： 1342

上一页
1
...
4
5
6
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

或者'Port forwarding is disabled.”如何解决？ - AI开发平台ModelArts

PD分离性能调优工具使用说明 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线