搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/generate”，输入预测代码“{"prompt": "你好"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

1分钟 tp_99 TP99 上1分钟内，统计该请求每次响应所消耗的时间，并将这些时间按从小到大的顺序进行排序，取第99%的值作为TP99的值。 ≥ms ModelArts在线服务 1分钟 tp_999 TP99.9 上1分钟内，统计该请求每次响应所消耗的时间，并将这些时间按从小到大的顺序进行排序，取第99

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
删除训练作业 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
准备镜像环境 - AI开发平台ModelArts

| grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备镜像环境 - AI开发平台ModelArts

| grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
停止训练作业版本 - AI开发平台ModelArts

训练作业的ID。 version_id 是 Long 训练作业的版本ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
停止可视化作业 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 String 可视化作业的ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数类型说明 is_success Boolean 请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
查询指定节点池详情 - AI开发平台ModelArts

是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 limit 否 String 分页单次查询返回数。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
删除节点池 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 资源池名称。 nodepool_name 是 String 节点池名称。请求参数无响应参数状态码： 200 表2 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。图7 服务部署完成 Step4 调用在线服务进入在线服务详情页面，选择“预测”。如果以vllm接口启动服务，设置请求路径：“/generate”，输入预测代码“{"prompt": "你好"

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
更新标注团队 - AI开发平台ModelArts

project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workforce_id 是 String 标注团队ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 标注团队描述，长度为0-256位，不能包含^

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

选择“multipart/form-data”时，需填写“请求参数”，请求参数取值等同于使用图形界面的软件进行预测（以Postman为例）Body页签中填写的“KEY”的取值，也等同于使用curl命令发送预测请求上传数据的参数名。设置完成后，单击“立即创建”，等待模型状态变为“正常”。单击新建的模型名称左侧

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
更新处理任务 - AI开发平台ModelArts

task_id 是 String 数据处理任务ID。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 数据处理任务描述，长度为0-256位，不能包含^!<>=&"'特殊字符。响应参数无请求示例更新数据处理任务 { "description"

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
准备镜像环境 - AI开发平台ModelArts

| grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装NPU设备和驱动，或释放被挂载的NPU。检查containerd是否安装。 containerd -v #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
重启可视化作业 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 String 可视化作业ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_code String 调用失败时的错误码，具体请参见错误码。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
Step4 测试用户权限 - AI开发平台ModelArts

在ModelArts左侧菜单栏中，选择“开发环境>Notebook”，单击“创建”，如果可以正常打开创建页面，说明具备ModelArts的操作权限。您也可以尝试其他功能，例如“训练管理>训练作业”等，如能正常打开创建页面，即可正常使用ModelArts。验证OBS权限。在左上角的服务列表中，选择OBS服务，进入OBS管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├── model.py # 发送请求的模块，在这里修改请求响应。目前支持vllm.openai，atb的tgi模板 ├── ... ├── eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

部署在线服务-专属资源池单击“下一步”，再单击“提交”，开始部署服务，待服务状态显示“正常”服务部署完成。 Step4 调用在线服务进入在线服务详情页面，选择“预测”。若以vllm接口启动服务，设置请求路径：“/generate”，输入预测代码“{"prompt": "你好", "temperature":0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
启动停止边缘节点服务实例 - AI开发平台ModelArts

边缘节点ID。在IEF上创建边缘节点后可得到。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。表3 请求Body参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询作业引擎规格 - AI开发平台ModelArts

String 指定作业的类型，可选的有“train”和“inference”。请求消息无请求参数。响应消息响应参数如表3所示。表3 响应参数参数参数类型说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 资源和引擎规格接口

总条数： 678

上一页
1
...
9
10
11
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

停止训练作业版本 - AI开发平台ModelArts

停止可视化作业 - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

删除节点池 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

更新标注团队 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

更新处理任务 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

Step4 测试用户权限 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

启动停止边缘节点服务实例 - AI开发平台ModelArts

查询作业引擎规格 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线