搜索_华为云

投机推理使用说明 - AI开发平台ModelArts

性。投机推理端到端推理示例以llama-2-13b-chat-hf模型作为LLM大模型，llama1.1b作为小模型，启用openai接口服务为例。使用下面命令启动推理服务。 base_model=/path/to/base_model spec_model=/path/to/spec_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

indows格式"D:/test.png"，Linux格式"/opt/data/test.png"），也可以使用相对路径（如"./test.png"）。在线服务的调用地址和输入参数信息，可以在控制台的“在线服务详情 > 调用指南”页面获取。 “API接口公网地址”即在线服务的调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
执行训练任务（推荐） - AI开发平台ModelArts

略任务如产生mc2融合算子错误，可参考mc2融合算子报错创建test-benchmark，该目录存放训练生成的权重文件及训练日志可以多次执行， # 任意目录创建 mkdir test-benchmark 进入test-benchmark目录执行训练命令，卡数及其它配置参考NPU卡数取值表按自己实际情况决定。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
查看训练作业日志 - AI开发平台ModelArts

xxx [ModelArts Service Log][init] download code_url: s3://dgg-test-user/snt9-test-cases/mindspore/lenet/ 类型二：time=“xxx” level=“xxx” msg=“xxx” file=“xxx”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

unzip val2014.zip wget http://images.cocodataset.org/zips/test2015.zip && unzip test2015.zip mkdir -p annotations && cd annotations/ # Download

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
查询训练作业日志 - AI开发平台ModelArts

Long 训练作业的版本ID。表2 Query参数参数是否必选参数类型说明 base_line 否 String 日志的基准位置，根据接口返回获得，为空的时候代表获取最新的日志。 lines 否 Integer 获取日志的长度，默认为50行。lines的范围为[0, 500]。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
部署推理服务 - AI开发平台ModelArts

"stream": false }' 方式二：通过vLLM服务API接口启动服务使用以下推理测试命令。下面以Llama系列模型采样方式支持presence_penalty参数的发送请求为例。此处的接口8080需和Step3 创建服务启动脚本中设置的宿主机端口保持一致。 curl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

/home/ma-user/work/envs/user_conda/sfs-tar-env test-env /home/ma-user/work/envs/user_conda/test-env 父主题： Standard开发环境

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境
多模态模型推理性能测试 - AI开发平台ModelArts

--height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel.csv中。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

如1小时），就可以避免防火墙将连接断开。服务器端配置（Notebook当前已经配置，24h应该是长于防火墙的断连时间配置，该配置无需用户手工修改，写在这里仅是帮助理解ssh配置原理）配置文件路径：/home/ma-user/.ssh/etc/sshd_config 每24h向c

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
msprobe精度分析工具使用指导 - AI开发平台ModelArts

对于网络中随机性的固定，msprobe提供了固定Seed的方式，只需要在config.json文件中添加对应seed配置即可。 msprobe工具提供了seed_all接口用于固定网络中的随机数。如果客户使用了工具但取用了其他随机种子，则必须使用客户的随机种子固定随机性。函数原型 from msprobe.pytorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
创建智能标注作业 - AI开发平台ModelArts

片，然后单击“确认”完成智能标注结果的确认。确认完成后的图片将被归类至“已标注”页面下。针对标为“难例”的图片，您可以根据实际情况判断，手工修正标签。详细操作及示例请参见•针对“图像分类”数据集。物体检测标注作业在“待确认”页面，单击图片查看标注详情，查看标签及目标框是否准

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
多模态模型推理性能测试 - AI开发平台ModelArts

--height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。备注：当前版本仅支持语言+图片多模态性能测试。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

--height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。备注：当前版本仅支持语言+图片多模态性能测试。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

--height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。备注：当前版本仅支持语言+图片多模态性能测试。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
查看在线服务详情 - AI开发平台ModelArts

明请参见表2。表2 在线服务详情参数说明调用指南展示API接口公网地址、模型信息、输入参数、输出参数。您可以通过复制API接口公网地址，调用服务。如果您支持APP认证方式，可以在调用指南查看API接口公网地址和授权管理详情，包括“应用名称”、“AppKey”、“AppS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务部署的IP。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
服务启动失败 - AI开发平台ModelArts

镜像如果配置了健康检查，服务启动失败，从以下两个方面进行排查：健康检查端口是否可以正常工作自定义镜像中配置了健康检查，需要在测试镜像时，同步测试健康检查接口是否可以正常工作，具体参考从0-1制作自定义镜像并创建AI应用中的本地验证镜像方法。创建模型界面上配置的健康检查地址与实际配置的是否一致

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
Lite Cluster&Server介绍 - AI开发平台ModelArts

通过选择资源池的驱动版本，解决资源池所有节点驱动版本一致的时候，并且没有指定驱动版本，会导致后续加入资源池的节点并不能自动升级到该版本情况，优化了当前需手工处理，增加运维成本问题。支持节点新进入集群，默认启用准入检测，以能够拉起真实的GPU/NPU检测任务支持集群扩容时，扩容的节点默认开启

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
推理性能测试 - AI开发平台ModelArts

benchmark_parallel.csv 参数说明 --backend：服务类型，支持tgi、vllm、mindspore、openai等。本文档使用的推理接口是vllm。 --host：服务部署的IP。 --port：推理服务端口8080。 --tokenizer：tokenizer路径，HuggingFace的权重路径。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）

总条数： 724

上一页
1
...
30
31
32
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

投机推理使用说明 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

InternVL2基于LIte Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

查询训练作业日志 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

将Notebook的Conda环境迁移到SFS磁盘 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

VS Code连接后长时间未操作，连接自动断开 - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

创建智能标注作业 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

Lite Cluster&Server介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线