搜索_华为云

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

部署类型：在线服务。请求模式：同步请求。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
工具介绍及准备工作 - AI开发平台ModelArts

具体步骤参考训练性能测试或训练精度测试，根据实际情况决定。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

ModelArts SDK不支持在训练作业和在线服务中使用。 ModelArts SDK已经集成在ModelArts开发环境Notebook中，可以直接使用，无需进行Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考
添加资源标签 - AI开发平台ModelArts

添加资源标签功能介绍给指定服务添加标签（目前只支持在线服务），当添加的标签key已存在，则覆盖该标签的value。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
更新模型服务的单个属性 - AI开发平台ModelArts

更新模型服务的单个属性功能介绍更新模型服务的单个属性，目前只支持instance_count(更新模型服务实例数量)，仅运行中、告警、异常状态下的在线服务可以执行该操作。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
服务预测失败 - AI开发平台ModelArts

常见报错：在线服务预测报错ModelArts.4302 在线服务预测报错ModelArts.4206 在线服务预测报错ModelArts.4503 当使用推理的镜像并且出现MR.XXXX类型的错误时，表示已进入模型服务，一般是模型推理代码编写有问题。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
在MaaS体验模型服务 - AI开发平台ModelArts

取值范围：1~1000 默认值：20 在对话框中输入问题，查看返回结果，在线体验模型服务。图3 体验模型服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
ModelArts Standard使用流程 - AI开发平台ModelArts

创建模型部署模型部署服务 ModelArts支持将模型部署为在线服务、批量服务和边缘服务。部署为在线服务部署为批量服务访问服务服务部署完成后，针对在线服务和边缘服务，您可以访问并使用服务，针对批量服务，您可以查看其预测结果。访问在线服务查看批量服务预测结果

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

精度测试 benchmark工具用于精度验证，主要工作原理是：固定模型的输入，通过benchmark工具进行推理，并将推理得到的输出与标杆数据进行相似度度量（余弦相似度和平均相对误差），得到模型转换后的精度偏差信息。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。图1 任务示意图操作步骤拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK 如果需要在个人PC或虚拟机上使用ModelArts SDK，则需要在本地环境中安装ModelArts SDK，安装后可直接调用ModelArts SDK轻松管理数据集、创建ModelArts训练作业及创建AI应用，并将其部署为在线服务

 帮助中心 > AI开发平台ModelArts > SDK参考
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：方式一 ModelArts Notebook：该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方notebook示例可直接运行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志问题现象用户通过OBS导入模型时，选择使用基础镜像，用户自己编写了部分推理代码实现自己的推理逻辑，出现故障后希望通过故障日志排查定位故障原因，但是通过logger打印日志无法在“在线服务”的日志中查看到部分内容

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

模型推理：在ModelArts中将模型部署上线为在线服务时，支持使用Snt3、Snt3P、Snt9、Snt9B规格资源进行模型推理。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

执行命令示例如下，直接访问在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

如果有免费CPU规格，可选择免费规格进行部署（每名用户限部署一个免费的在线服务，如果您已经部署了一个免费在线服务，需要先将其删除才能部署新的免费在线服务）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练
创建失败的专属资源池删除后，控制台为什么还能看到？ - AI开发平台ModelArts

如果做UI自动化测试，建议用例用随机串替代。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

以下值是在gpu-memory-utilization为0.9时测试得出，为服务部署所需的最小昇腾卡数及该卡数下推荐的最大max-model-len长度，不代表最佳性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）

总条数： 463

上一页
1
...
8
9
10
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

工具介绍及准备工作 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

服务预测失败 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

通过OBS导入模型时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志 - AI开发平台ModelArts

支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

创建失败的专属资源池删除后，控制台为什么还能看到？ - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

附录：基于vLLM不同模型推理支持最小卡数和最大序列说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线