搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理性能测试 - AI开发平台ModelArts

Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
更新资源池 - AI开发平台ModelArts

描述 flavor 是 String 资源规格。 count 是 Integer 相应规格的资源数量。 azs 否 Array of PoolNodeAz objects 更新的AZ列表。表8 PoolNodeAz 参数是否必选参数类型描述 az 是 String 可用区名称。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json，可参考表2.请求服务json参数说明 docker_ip 是 str 启动多模态openAI服务的主机ip served_port 是 str 启动多模态openAI服务的端口号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
查询镜像详情 - AI开发平台ModelArts

/v1/{project_id}/images/{id} 表1 路径参数参数是否必选参数类型描述 id 是 String 镜像ID。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
推理性能测试 - AI开发平台ModelArts

Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
VS Code ToolKit连接Notebook - AI开发平台ModelArts

Instance”，启动并连接Notebook实例。 Notebook实例状态处于“运行中”或“停止”状态都可以，如果Notebook实例是停止状态，连接Notebook时，VS Code插件会先启动实例再去连接。图8 连接Notebook实例或者单击实例名称，在VS Cod

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

AscendCloud-6.3.911软件包中的AscendCloud-AIGC-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.911 版本。说明：如果上述软件获取路

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查询训练作业列表 - AI开发平台ModelArts

训练作业运行时节点数变化指标。 tasks Array of strings 训练作业子任务名称。 start_time String 训练作业开始时间，格式为时间戳。 task_statuses Array of objects 训练在子任务状态信息。表7 task_statuses 参数参数类型

 帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
推理性能测试 - AI开发平台ModelArts

Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

ler：使用微调的alpaca数据集。 MBS 1 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 128 表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
创建训练作业 - AI开发平台ModelArts

表6 nfs属性列表参数是否必选参数类型说明 id 是 String SFS Turbo 文件系统 ID。 src_path 是 String SFS Turbo 文件系统地址。 dest_path 是 String 训练作业的本地路径。 read_only 否 Boolean

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
部署推理服务 - AI开发平台ModelArts

image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json，可参考表2.请求服务json参数说明 docker_ip 是 str 启动多模态openAI服务的主机ip served_port 是 str 启动多模态openAI服务的端口号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
部署推理服务 - AI开发平台ModelArts

image_path 是 str 传给模型的图片路径 payload 是 json 单图单轮对话的post请求json，可参考表2.请求服务json参数说明 docker_ip 是 str 启动多模态openAI服务的主机ip served_port 是 str 启动多模态openAI服务的端口号

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
快速配置ModelArts委托授权 - AI开发平台ModelArts

IAM修改委托权限”。图6 去IAM修改委托权限进入IAM控制台的委托页面。找到对应的委托信息，修改该委托的基本信息，主要是持续时间。“持续时间”可以选择永久、1天，或者自定义天数，例如 30天。图7 手动创建的委托在授权记录页面单击“授权”，勾选要配置的策略，单击下一步

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作 > 配置ModelArts Standard访问授权
Lite Cluster资源管理介绍 - AI开发平台ModelArts

tes集群内的节点，ModelArts支持通过节点池来管理节点。节点池是集群中具有相同配置的一组节点，一个节点池包含一个节点或多个节点，您可以创建、更新和删除节点池。管理Lite Cluster节点：节点是容器集群组成的基本元素，您可以对资源池内单节点进行替换、删除、重置等操作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建资源池 - AI开发平台ModelArts

请求Body参数参数是否必选参数类型描述 apiVersion 是 String API版本。可选值如下： v2 kind 是 String 资源类型。可选值如下： Pool：资源池 metadata 是 PoolMetadataCreation object 资源池的metadata信息。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

Lite的Lite Server环境中，使用NPU卡训练Wav2Lip模型。本文档中提供的Wav2Lip模型，是在原生Wav2Lip代码基础上适配后的模型，可以用于NPU芯片训练。 Wav2Lip是一种基于对抗生成网络的由语音驱动的人脸说话视频生成模型。主要应用于数字人场景。不仅可以基于静态图

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
推理性能测试 - AI开发平台ModelArts

Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒导致调用失败，可提交工单设置请求超时时间。 benchmark方法介绍性能benchmark包括两部分。静态性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

/v1/{project_id}/images/{id} 表1 路径参数参数是否必选参数类型描述 id 是 String 镜像ID。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理

总条数： 1088

上一页
1
...
20
21
22
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

更新资源池 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询镜像详情 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

快速配置ModelArts委托授权 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线