搜索_华为云

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

减少参数--prompt-tokens和--output-tokens的值，或者增大启动服务的参数--max-model-len的值。问题11：使用离线推理时，性能较差或精度异常解决方法：将block_size大小设置为128 from vllm import LLM, SamplingParams

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 附录
附录：大模型推理常见问题 - AI开发平台ModelArts

减少参数--prompt-tokens和--output-tokens的值，或者增大启动服务的参数--max-model-len的值。问题11：使用离线推理时，性能较差或精度异常解决方法：将block_size大小设置为128 from vllm import LLM, SamplingParams

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

减少参数--prompt-tokens和--output-tokens的值，或者增大启动服务的参数--max-model-len的值。问题11：使用离线推理时，性能较差或精度异常解决方法：将block_size大小设置为128 from vllm import LLM, SamplingParams

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
附录：大模型推理常见问题 - AI开发平台ModelArts

减少参数--prompt-tokens和--output-tokens的值，或者增大启动服务的参数--max-model-len的值。问题11：使用离线推理时，性能较差或精度异常解决方法：将block_size大小设置为128 from vllm import LLM, SamplingParams

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
创建团队标注任务 - AI开发平台ModelArts

式不同，详细请参见：标注图片（图像分类）标注图片（物体检测）标注文本（文本分类）标注文本（命名实体）标注文本（文本三元组）标注音频（语音分割）在标注页面中，每个成员可查看“未标注”、“待确认”、“已驳回”、“待审核”、“审核通过”、“验收通过”的图片信息。请及时关注管理员驳回以及待修正的图片。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
使用AWQ量化 - AI开发平台ModelArts

详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
投机推理使用说明 - AI开发平台ModelArts

机流程，平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

no valid version specifier) modelarts==latest 针对以上报错，可重新安装更低版本的pip，或将离线包名modelarts-latest-py2.py3-none-any.whl中的latest修改为任意版本号，例如modelarts-1

帮助中心 > AI开发平台ModelArts > SDK参考
创建数据集 - AI开发平台ModelArts

data_sources 是 Array of DataSource objects 数据集输入位置，用于将此目录及子目录下的源数据(如图片/文件/音频等)同步到数据集。对于表格数据集，该参数为导入目录。表格数据集的工作目录不支持为KMS加密桶下的OBS路径。目前仅支持传入单个DataSource。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建Workflow训练作业节点 - AI开发平台ModelArts

创建Workflow训练作业节点功能介绍该节点通过对算法、输入、输出的定义，实现ModelArts作业管理的能力。主要用于数据处理、模型训练、模型评估等场景。主要应用场景如下：当需要对图像进行增强，对语音进行除噪等操作时，可以使用该节点进行数据的预处理。对于一些物体检测，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

在ModelArts中图像分类和物体检测具体是什么？图像分类是根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像元或区域划归为若干个类别中的某一种，以代替人的视觉判读。简单的说就是识别一张图中是否

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？服务部署完成且服务处于运行中后，可以往该服务发送推理的请求，请求的内容根据模型的不同可以是文本，图片，语音，视频等内容。当使用调用指南页签中显示的调用地址（华为云APIG网关服务的地址）预测时，对请求体的大小限制是12MB，超过12MB时，请求会被拦截。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
批量更新团队标注样本的标签 - AI开发平台ModelArts

批量更新团队标注样本的标签功能介绍批量更新团队标注样本的标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT /v2/{project_id}/data

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
批量更新样本标签 - AI开发平台ModelArts

批量更新样本标签功能介绍批量更新样本标签，包括添加、修改和删除样本标签。当请求体中单个样本的“labels”参数传空列表时，表示删除该样本的标签。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
管理Lite Cluster节点 - AI开发平台ModelArts

地盘数据可以保留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移到新服务器，本地盘数据会被清空，请提前做好业务迁移和数据备份。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
查询单个智能标注样本的信息 - AI开发平台ModelArts

查询单个智能标注样本的信息功能介绍查询单个智能标注样本的信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/data

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
更新团队标注验收任务状态 - AI开发平台ModelArts

更新团队标注验收任务状态功能介绍在团队标注任务完成验收前确认验收范围以及是否覆盖已标注的数据，以此更新样本状态。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询单个样本信息 - AI开发平台ModelArts

查询单个样本信息功能介绍查询单个样本信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{data

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）

总条数： 212

上一页
1
...
4
5
6
...
11
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Ascend-vLLM推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

查询单个智能标注样本的信息 - AI开发平台ModelArts

更新团队标注验收任务状态 - AI开发平台ModelArts

查询单个样本信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线