搜索_华为云

Ascend-vLLM介绍 - AI开发平台ModelArts

compile Torch.dynamo构图，转ascend-GE后端推理；使用静态分档。实例复用 Multi-lora 多lora挂载，多个不同微调模型共用一份权重同时部署。控制输出 Guided Decoding 通过特定模式控制模型输出。 Beam search 通过beamsearch输出多个候选结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
Ascend-vLLM介绍 - AI开发平台ModelArts

compile Torch.dynamo构图，转ascend-GE后端推理；使用静态分档。实例复用 Multi-lora 多lora挂载，多个不同微调模型共用一份权重同时部署。控制输出 Guided Decoding 通过特定模式控制模型输出。 Beam search 通过beamsearch输出多个候选结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
执行训练任务（历史版本） - AI开发平台ModelArts

scripts_modellink/llama2/0_pl_sft_70b.sh 以上命令多台机器执行时，只有${NODE_RANK}的节点ID值不同，其他参数都保持一致。其中MASTER_ADDR、 NNODES、 NODE_RANK为必填。单机启动对于Llama2-7b和Llam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.5.901） > 执行训练任务
准备镜像环境 - AI开发平台ModelArts

构建ModelArts Lite训练镜像中使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：Step3中自己创建的组织名称。示例：GROUP_NAME <镜像名称>:<版本名称>：定义镜像名称。示

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

-modelarts”的桶，并创建如表1所示的文件夹。创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。请确保您使用的OBS与ModelArts在同一区域。表1 OBS桶文件夹列表文件夹名称用途 obs://test-modelarts/ascend/demo-code/

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查看Standard专属资源池详情 - AI开发平台ModelArts

百分比（Percent） 0～100% GPU/NPU碎片数由于资源调度产生碎片，导致某些卡虽然空闲，但无法被多卡任务所使用。不同卡数的任务，根据已占用卡的分布不同，实际会有不同的碎片情况，且随时间变化，表格中仅表示当前时间的状态。 / / 管理资源池标签通过给资源池添加标签，可以标识云资源，便于快速搜索资源池。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？问题定位和处理创建模型失败有两种场景：创建模型时直接报错或者是调用API报错和创建模型任务下发成功，但最终模型创建失败。创建模型时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。创建模型任务下发成功，

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
断点续训练 - AI开发平台ModelArts

断点续训练断点续训练是指因为某些原因导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
断点续训练 - AI开发平台ModelArts

断点续训练断点续训练是指因为某些原因导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
删除授权 - AI开发平台ModelArts
删除授权 - AI开发平台ModelArts

删除授权功能介绍删除指定用户的授权或者删除全量用户的授权。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI DELETE /v2/{project_id}/authorizations

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
扩缩容Standard专属资源池 - AI开发平台ModelArts

致，可能会使得部分任务在不同节点的运行情况不一致，请谨慎操作。存量节点不支持修改容器引擎空间大小。修改操作系统。在“操作系统”下拉列表中指定操作系统版本。指定节点计费模式。用户增加节点数量时，可以打开“节点计费模式”开关，为资源池新扩容的节点设置不同于资源池的计费模式、购买时

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
自定义镜像使用场景 - AI开发平台ModelArts

模型，可以通过制作自定义镜像，导入ModelArts创建为模型，并支持进行统一管理和部署为服务。用户制作的自定义镜像，使用的场景不同，镜像规则也不同，具体如下：通用规则：SWR镜像类型为“私有”时，才可以共享给他人，适用于开发环境、训练作业、模型。开发环境：SWR镜像类型为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

盖了算法开发、服务运维和业务运行的整个AI流程。方案概述推理服务的端到端运维流程算法开发阶段，先将业务AI数据存放到对象存储服务（OBS）中，接着通过ModelArts数据管理进行标注和版本管理，然后通过训练获得AI模型结果，最后通过开发环境构建模型镜像。服务运维阶段，先

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

确保容器可以访问公网。步骤一：检查环境请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买Server资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？调用API接口创建训练作业时，“pool_id”为“资源池ID”。调用API接口部署在线服务时，“pool_name”为“资源池ID” 。图1 资源池ID 父主题： API/SDK

帮助中心 > AI开发平台ModelArts > 常见问题 > API/SDK
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐）相对于之前demo.sh方式启动（历史版本）的启动方式，本章节新增了通过benchmark工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管理训练日志、训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐）相对于之前demo.sh方式启动（历史版本）的启动方式，本章节新增了通过benchmark工具启动训练的方式。此方式训练完成后json日志或打屏日志直接打印性能结果，免于计算，方便用户验证发布模型的质量。并且新的训练方式将统一管理训练日志、训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

支持“公开”和“AppCode认证”。公开：无需认证，API地址可被公开访问。 AppCode认证：需使用有效的AppCode进行认证。AppCode使用API网关颁发的AppCode进行身份认证，调用者将AppCode放到请求头中进行身份认证，确保只有授权的调用者能够调用API接口。 AppCode的获取方法：单击AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

录中。运行用户ID 容器运行时的用户ID，该参数为选填参数，建议使用默认值1000。如果需要指定uid，则uid数值需要在规定范围内，不同资源池的uid范围如下：公共资源池：1000-65535 专属资源池：0-65535 启动命令必填，镜像的启动命令。运行训练作业时，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型

总条数： 1323

上一页
1
...
38
39
40
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Ascend-vLLM介绍 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

删除授权 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

SD3基于Lite Server适配PyTorch NPU的训练指导（6.3.912） - AI开发平台ModelArts

调用ModelArts API接口创建训练作业和部署服务时，如何填写资源池的参数？ - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线