搜索_华为云

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

擎选择Custom，引擎包选择步骤3构建的镜像。图3 创建模型将创建的模型部署为在线服务，大模型加载启动的时间一般大于普通的模型创建的服务，请配置合理的“部署超时时间”，避免尚未启动完成被认为超时而导致部署失败。图4 部署为在线服务调用在线服务进行大模型推理，请求路径填写

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
重试/停止/运行Workflow节点 - AI开发平台ModelArts

置后，可单击“继续运行”按钮并确认继续执行当前节点。部分运行Workflow节点针对大型、复杂的Workflow，为节省重复运行消耗的时间，在运行业务场景时，用户可以选择其中的部分节点作为业务场景运行，工作流在执行时将会按顺序执行部分运行节点。部分运行Workflow节点，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

口是唯一不需要认证的接口。否，使用Token认证时必选。 - X-Sdk-Date 请求的发生时间，格式为(YYYYMMDD'T'HHMMSS'Z')。取值为当前系统的GMT时间。否，如果使用AK/SK做接口认证的时候，那么此字段必须设置；如果使用PKI token的时候，不必设置。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

进行Session鉴权。可参见（可选）Session鉴权完成鉴权。鉴权完成后，即可开始使用。 SDK版本说明表1 ModelArts SDK版本说明发布时间版本号说明 2023-04 1.4.18 1.4.18版本在SDK旧版本基础上优化集成，主要新增DLI Spark任务提交能力，支持服务部署到推理新版专属资源池。

帮助中心 > AI开发平台ModelArts > SDK参考
Lite Cluster资源管理介绍 - AI开发平台ModelArts

、重置等操作，也可以批量对节点进行删除、退订、续费等操作。扩缩容Lite Cluster资源池：当Cluster资源池创建完成，使用一段时间后，由于用户AI开发业务的变化，对于资源池资源量的需求可能会产生变化，面对这种场景，ModelArts提供了扩缩容功能，用户可以根据自己的需求动态调整。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

实际存储空间足够，却依旧报错“No Space left on device”。同一目录下创建较多文件，为了加快文件检索速度，内核会创建一个索引表，短时间内创建较多文件时，会导致索引表达到上限，进而报错。触发条件和下面的因素有关：文件名越长，文件数量的上限越小 blocksize越小，文件数量的上限越小。（

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查看日志和性能 - AI开发平台ModelArts

Loss收敛情况（示意图）注：ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910）
查看日志和性能 - AI开发平台ModelArts

Loss收敛情况（示意图） ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能。父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
查看日志和性能 - AI开发平台ModelArts

Loss收敛情况（示意图） ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能。父主题：主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
资源池统计 - AI开发平台ModelArts

参数类型描述 statistics statistics object 资源池统计信息。 operationTime String 统计的时间。表4 statistics 参数参数类型描述 status status object 不同状态下的资源池统计信息。表5 status

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
训练迁移快速入门案例 - AI开发平台ModelArts

训练迁移快速入门案例本篇指导是迁移的总体思路介绍，便于用户对迁移过程有一个整体的认识。如果您希望通过具体案例直接实操，请参考《主流开源大模型基于DevServer适配PyTorch NPU训练指导》。该案例以ChatGLM-6B为例，介绍如何将模型迁移至昇腾设备上训练、模型精度对齐以及性能调优。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
查看日志和性能 - AI开发平台ModelArts

Loss收敛情况（示意图） ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能。图3 trainer_log.jsonl文件父主题：主流开源大模型基于Lite Server适配LlamaFactory

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

emUsage”“npuMemUsage”、“npuUtil”、可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。表2 参数说明参数说明 cpuUsage cpu使用率。 gpuMemUsage gpu内存使用率。 gpuUtil

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
创建ModelArts人工标注作业 - AI开发平台ModelArts

语音内容：对语音内容进行标注。语音分割：对语音进行分段标注。文本文本分类：对文本的内容按照标签进行分类处理。命名实体：针对文本中的实体片段进行标注，如“时间”、“地点”等。文本三元组：针对文本中的实体片段和实体之间的关系进行标注。视频视频标注：识别出视频中每个物体的位置及分类。目前仅支持mp4格式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
Lite Cluster资源配置流程 - AI开发平台ModelArts

（可选）配置镜像预热 Lite Cluster资源池支持镜像预热功能，镜像预热可实现将镜像提前在资源池节点上拉取好，在推理及大规模分布式训练时有效缩短镜像拉取时间。快速配置Lite Cluster资源案例下文提供一个快速配置的案例，配置完成后您可登录到节点查看加速卡信息并完成一个训练任务。在运行

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

性，如： #!/bin/bash while true; do nvidia-smi & sleep 1 # 可以根据需要调整间隔时间 done 然后执行查看产生nvidia D+进程 ps -aux | grep -w D+ 结果如下：图1 nvidia D+进程此

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

软件配套版本和获取地址软件名称说明下载地址 AscendCloud-3rdLLM-6.3.905-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的vLLM 0.3.2推理部署代码和推理评测代码。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。获取路径：Support-E

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

906-xxx.zip软件包中的AscendCloud-AIGC-6.3.906-xxx.zip 说明：包名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E。说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像西南-贵阳一：swr

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
Lite Server资源开通 - AI开发平台ModelArts

用户基于外部镜像文件或裸金属服务器创建的个人镜像，仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建，可以节省您重复配置服务器的时间。表5 选择网络参数说明参数名称说明虚拟私有云配置Server的虚拟私有云（Virtual Private Cloud，简称VP

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）

总条数： 914

上一页
1
...
41
42
43
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

Lite Cluster资源管理介绍 - AI开发平台ModelArts

下载或读取文件报错，提示超时、无剩余空间 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

Lite Server资源开通 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线