搜索_华为云

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）场景介绍准备工作在Notebook调试环境中部署推理服务在推理生产环境中部署推理服务推理精度测试推理性能测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：Standard大模型推理常见问题

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
服务管理概述 - AI开发平台ModelArts

服务管理概述服务管理，包括将已创建成功的模型部署为在线服务或本地服务。可以实现在线预测、本地预测、服务详情查询、查看服务日志等功能。这里的在线服务包括“predictor”和“transformer”两类，都包括下文描述的功能，本章节以“predictor”服务为例进行说明。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
订阅免费算法 - AI开发平台ModelArts

Gallery中，您可以查找并订阅免费满足业务需要的算法，直接用于创建训练作业。 AI Gallery中分享的算法支持免费订阅，但在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。订阅算法登录“AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

KooSearch企业搜索服务：基于在MaaS开源大模型部署的模型API，搭建企业专属方案、LLM驱动的语义搜索、多模态搜索增强。盘古数字人大脑：基于在MaaS开源大模型部署的模型API，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应用构建开源解决方案，用于Agent编排、自定义工作流。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查询服务列表 - AI开发平台ModelArts

deploying：部署中，服务正在部署，调度资源部署等。 concerning：告警，后端实例异常，可能正在计费。例如多实例的情况下，有的实例正常，有的实例异常。正常的实例会产生费用，此时服务状态是concerning。 failed：失败，服务部署失败，失败原因可以查看事件和日志标签。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
数据准备使用流程 - AI开发平台ModelArts

数据准备使用流程 ModelArts是面向AI开发者的一站式开发平台，能够支撑开发者从数据到模型的全流程开发过程，包含数据处理、算法开发、模型训练、模型部署等操作。并且提供AI Gallery功能，能够在市场内与其他开发者分享数据、算法、模型等。为了能帮用户快速准备大量高质量的数据，Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
开发环境计费项 - AI开发平台ModelArts

开发环境计费项计费说明在ModelArts开发环境中运行Notebook实例时，会使用计算资源和存储资源，会产生计算资源和存储资源的累计值计费。具体内容如表1所示。 Notebook实例停止运行时，EVS还会持续计费，需及时删除才能停止EVS计费。计算资源费用：如果运行N

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Standard资源管理 - AI开发平台ModelArts

Standard开发平台的训练作业、部署模型以及开发环境时，可以使用Standard专属资源池的计算资源。使用前，您需要先购买创建一个专属资源池。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等，均

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Standard自动学习 - AI开发平台ModelArts

让零AI基础的业务开发者可快速完成模型的训练和部署。 ModelArts自动学习，为入门级用户提供AI零代码解决方案支持图片分类、物体检测、预测分析、声音分类场景自动执行模型开发、训练、调优和推理机器学习的端到端过程根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
查询OS的配额 - AI开发平台ModelArts

查询OS的配额功能介绍获取ModelArts OS服务中部分资源的配额，如资源池配额、网络配额等。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

右方操作下的“停止”即可停止计费。进入“ModelArts>模型部署>在线服务”页面，检查是否有“运行中”的推理作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。进入“ModelArts>模型部署>批量服务”页面，检查是否有“运行中”的推理作业。如果有，单击该作业列表右方操作下的“停止”即可停止计费。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
推理业务迁移评估表 - AI开发平台ModelArts

推理业务迁移评估表通用的推理业务及LLM推理可提供下表进行业务迁移评估：收集项说明实际情况（请填写）项目名称项目名称，例如：XXX项目。 - 使用场景例如：使用YOLOv5算法对工地的视频流裁帧后进行安全帽检测。使用BertBase算法对用户在app上购买商品后的评论进行理解。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Controlnet训练 - AI开发平台ModelArts

通过图像特征来为扩散模型的生成过程提供更加精细控制的方式。将Controlnet适配到昇腾卡进行训练，可以提高能效、支持更大模型和多样化部署环境，提升昇腾云在图像生成和编辑场景下的竞争力。本章节介绍SDXL&SD 1.5模型的Controlnet训练过程。 Step1 处理fill50k数据集

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
系统容器异常退出 - AI开发平台ModelArts

系统容器异常退出问题现象在训练创建后出现“系统容器异常退出”的故障。 [ModelArts Service Log]2022-10-11 19:18:23,267 - file_io.py[1ine:748] - ERROR: stat:404 errorCode:NoSuchKey

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
性能调优总体原则和思路 - AI开发平台ModelArts

性能调优总体原则和思路 PyTorch在昇腾AI处理器的加速实现方式是以算子为粒度进行调用（OP-based），即通过Python与C++调用CANN层接口Ascend Computing Language（AscendCL）调用一个或几个亲和算子组合的形式，代替原有GPU的实现

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
自动学习 - AI开发平台ModelArts
自动学习 - AI开发平台ModelArts

自动学习准备数据模型训练部署上线模型发布

 帮助中心 > AI开发平台ModelArts > 故障排除
在模型广场查看模型 - AI开发平台ModelArts

ModelArts Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。非量化模型可以支持调优、压缩、部署等操作。量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时，则可以通过对非量化模型进行模型压缩获取。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

迁移评估推理迁移包括模型迁移、业务迁移、精度性能调优等环节，是否能满足最终的迁移效果需要进行系统的评估。如果您仅需要了解迁移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写下方的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
DeepSeek系列模型推理 - AI开发平台ModelArts

DeepSeek系列模型推理 DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

 帮助中心 > AI开发平台ModelArts > 最佳实践

总条数： 1595

上一页
1
...
73
74
75
...
80
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

服务管理概述 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

开发环境计费项 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

查询OS的配额 - AI开发平台ModelArts

如果不再使用ModelArts，如何停止收费？ - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

Controlnet训练 - AI开发平台ModelArts

系统容器异常退出 - AI开发平台ModelArts

性能调优总体原则和思路 - AI开发平台ModelArts

自动学习 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

DeepSeek系列模型推理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线