搜索_华为云

部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。 openssl genrsa -out key.pem 2048 openssl req -new -x509 -key key

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 准备工作
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

在ECS中执行如下命令，会在当前目录生成cert.pem和key.pem，并将生成的pem证书上传至OBS。证书用于后续在推理生产环境中部署HTTPS推理服务。 openssl genrsa -out key.pem 2048 openssl req -new -x509 -key key

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
推理精度测试 - AI开发平台ModelArts

精度评测可以在原先conda环境，进入到一个固定目录下，执行如下命令。 rm -rf lm-evaluation-harness/ git clone https://github.com/EleutherAI/lm-evaluation-harness.git cd lm-evaluation-harness

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
非分离部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
部署模型为在线服务 - AI开发平台ModelArts

大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。 “环境变量” 设置环境变量，注入环境变量到容器实例。为确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。 “部署超时时间” 用于设置单个模型实例的超时时间，包括部署和启动时间。默认值为20分钟，输入值必须在3到120之间。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
更新网络资源 - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例打通VPC。 PATCH https://{endpoint}/v1/{project_id}/networks/{network_name} { "spec" : {

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建训练作业参数 - AI开发平台ModelArts

调用成功时无此字段。请求示例如下以创建名为“testConfig”，描述为“This is config”的训练作业参数为例。 POST https://endpoint/v1/{project_id}/training-job-configs { "config_name":

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
精度调优总体思路 - AI开发平台ModelArts

精度调优总体思路 PyTorch大模型训练的精度问题的分析、定位可以参考如下思路：大模型训练通常使用多机训练，鉴于多机训练复现问题的成本较高，且影响因子较多，建议用户先减少模型层数，使模型能够单机训练，确认单机训练是否也存在精度问题，若存在，则使用下述手段定位精度问题，使得单机精度达标，然后再恢复层数拉起多机训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

该镜像所对应的描述信息，长度限制512个字符。 dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Noteboo

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询AI应用列表 - AI开发平台ModelArts

最小GPU规格。 min_memory String 最小内存。 min_ascend String 最小Ascend规格。请求示例 GET https://{endpoint}/v1/{project_id}/models 响应示例状态码：200 模型列表 { "total_count"

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
团队成员查询团队标注任务列表 - AI开发平台ModelArts

unreviewed_sample_count Integer labeler标注完未被reviewer审核的样本数目。请求示例团队成员查询团队标注任务列表 GET https://{endpoint}/v2/{project_id}/workforces/worker-tasks?offset=0&limit

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新训练作业参数 - AI开发平台ModelArts

String 调用失败时的错误码，具体请参见错误码。调用成功时无此字段。请求示例如下以更新名为“config”的作业参数为例。 PUT https://endpoint/v1/{project_id}/training-job-configs/config { "config_desc":

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
非分离部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

接口启动2种方式。详细启动服务与请求方式参考：https://docs.vllm.ai/en/latest/getting_started/quickstart.html。以下服务启动介绍的是在线推理方式，离线推理请参见https://docs.vllm.ai/en/lates

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
查询模型runtime - AI开发平台ModelArts

描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例 GET https://{endpoint}/v1/{project_id}/models/ai-engine-runtimes 响应示例状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

2312-aarch64-snt9b-20240606190017-b881580 RUN cd /home/ma-user && git clone https://github.com/comfyanonymous/ComfyUI.git -c http.sslVerify=false && cd

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集本节以准备训练物体检测模型的数据为例，介绍如何针对样例数据，进行数据分析、数据标注等操作，完成数据准备工作。在实际业务开发过程中，可以根据业务需求选择数据管理的一种或多种功能完成数据准备。此次操作分为以下流程：准备工作创建数据集数据分析

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理

总条数： 767

上一页
1
...
33
34
35
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

创建训练作业参数 - AI开发平台ModelArts

精度调优总体思路 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

团队成员查询团队标注任务列表 - AI开发平台ModelArts

更新训练作业参数 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

入门案例：快速创建一个物体检测的数据集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线