搜索_华为云

续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

包年/包月专属资源池到期后会影响ModelArts正常使用。如果您想继续使用，需要在指定的时间内为专属资源池续费，否则资源会自动释放，数据丢失且不可恢复。续费操作仅适用于包年/包月专属资源池，按需计费专属资源池不需要续费，只需要保证账户余额充足即可。专属资源池在到期前续费成功，所有资源得以

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
推理部署使用场景 - AI开发平台ModelArts

T平台，或者批量生成推理结果。图1 推理简介训练模型：可以在ModelArts服务中进行，也可以在您的本地开发环境进行，本地开发的模型需要上传到华为云OBS服务。创建模型：把模型文件和推理文件导入到ModelArts的模型仓库中，进行版本化管理，并构建为可运行的模型。部署

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
通过Token认证的方式访问在线服务 - AI开发平台ModelArts

如果在线服务的状态处于“运行中”，则表示在线服务已部署成功，部署成功的在线服务，将为用户提供一个可调用的API，此API为标准Restful API。在集成至生产环境之前，需要对此API进行调测，您可以使用以下方式向在线服务发起预测请求：方式一：使用图形界面的软件进行预测（以Postman为例）。Windows系统建议使用Postman。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

警功能一起使用。 SMN FullAccess 可选 VPC虚拟私有云子账号在创建ModelArts的专属资源池过程中，如果需要开启自定义网络配置，需要配置VPC权限。 VPC FullAccess 可选 SFS弹性文件服务授予子账号使用SFS服务的权限，ModelArts的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
ModelArts支持使用ECS创建专属资源池吗？ - AI开发平台ModelArts

ModelArts支持使用ECS创建专属资源池吗？不支持。创建资源池时，只能选择界面提供的“未售罄”节点规格进行创建。专属资源池的节点规格后台是对应的ECS资源，但是无法使用账号下购买的ECS，作为ModelArts专属资源池。父主题： Standard资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
推理性能测试 - AI开发平台ModelArts

大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-total-tokens值需要大于该值，tokenizer建议带tokenizer.json的FastTokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。模型权重文件获取地址请参见表1。若需要部署量化模型，请参考推理模型量化在Notebook中进行权重转换，并将转换后的权重上传至OBS中。权重文件夹不要以"model"命名，若

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

PYTORCH_NPU_ALLOC_CONF=expandable_segments:False；llava多卡启动时需要关闭虚拟内存扩展；开启时可能提升模型性能。允许分配器最初创建一个段，然后在以后需要更多内存时扩展它的大小。 --image-input-type：图像输入模式，pixel_values

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。模型权重文件获取地址请参见支持的模型列表和权重文件。若需要部署量化模型，请参考推理模型量化在Notebook中进行权重转换，并将转换后的权重上传至OBS中。权重文件夹不要以"model"命名，若

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-total-tokens值需要大于该值，tokenizer建议带tokenizer.json的FastTokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
服务启动失败 - AI开发平台ModelArts

模型推理代码customize_service.py编写有问题镜像拉取失败资源不足，服务调度失败模型本身问题，无法启动如果创建模型使用的镜像本身有问题，需要在创建模型之前，参考从0-1制作自定义镜像并创建AI应用，确保镜像可以正常启动，并可以在本地curl通返回预期内容。镜像中配置的端口错误

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
解析Manifest文件 - AI开发平台ModelArts

解析Manifest文件解析Manifest文件，支持本地和OBS。如果是OBS，需要Session信息。 manifest.parse_manifest(manifest_path, encoding='utf-8') 示例代码通过Manifest路径来解析获取Manifest的信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
IEF节点边缘服务部署失败 - AI开发平台ModelArts

IEF节点边缘服务部署失败问题现象部署边缘服务时，出现“异常”状态。原因分析1 部署边缘服务时，使用到IEF纳管的边缘节点，就需要用户给ModelArts的委托赋予Tenant Administrator权限，否则将无法成功部署边缘服务。具体可参见IEF的权限说明。处理方法1

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
推理性能测试 - AI开发平台ModelArts

大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-total-tokens值需要大于该值，tokenizer建议带tokenizer.json的FastTokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

准备资源创建专属资源池本文档中的模型运行环境是ModelArts Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。创建OBS桶 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
Standard资源池功能介绍 - AI开发平台ModelArts

ts进行AI开发（包括自动学习、创建Workflow工作流、创建Notebook实例、创建训练作业和创建推理服务）所需的计算资源，您可根据需要购买使用Standard资源池。图1 在AI开发时使用Standard资源池 ModelArts Standard资源池说明在使用Mo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

度>8192，则需要在启动推理服务前添加如下环境变量降低显存占用；否则在长序列的推理中会触发Out of Memory，导致推理服务不可用。 export USE_PREFIX_HIGH_PRECISION_MODE=1 如果需要使用multi-lora特性；需要在推理服务启动命令中额外添加如下命令。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-total-tokens值需要大于该值，tokenizer建议带tokenizer.json的FastTokenizer。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

PYTORCH_NPU_ALLOC_CONF=expandable_segments:False；llava多卡启动时需要关闭虚拟内存扩展；开启时可能提升模型性能。允许分配器最初创建一个段，然后在以后需要更多内存时扩展它的大小。 --image-input-type：图像输入模式，pixel_values

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

总条数： 1295

上一页
1
...
16
17
18
...
65
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

续费概述 - AI开发平台ModelArts

推理部署使用场景 - AI开发平台ModelArts

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

ModelArts支持使用ECS创建专属资源池吗？ - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

IEF节点边缘服务部署失败 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线