搜索_华为云

SFT全参微调训练 - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 HF_SAVE_DIR：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
训练作业卡死检测 - AI开发平台ModelArts

期内，作业所有进程IO都没有变化，则进入资源利用率检测阶段。资源利用率：在作业进程IO没有变化的情况下，采集一定时间段内的GPU利用率或NPU利用率，并根据这段时间内的GPU利用率或NPU利用率的方差和中位数来判断资源使用率是否有变化。如果没有变化，则判定作业卡死。系统预置了

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
查询样本列表 - AI开发平台ModelArts

__WORKFORCE_SAMPLED_REJECTED__：采样已驳回 __AUTO_ANNOTATION__：待确认 sample_time Long 样本时间，OBS最后修改时间。 sample_type Integer 样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询AI应用详情 - AI开发平台ModelArts

String 版本限制条件，当且仅当package_version存在时必填，取值包含： EXACT：和指定的版本完全一致。 ATLEAST：不低于指定的版本。 ATMOST：不高于指定的版本。表8 ModelSpecification 参数参数类型描述 min_cpu String

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
执行训练任务（推荐） - AI开发平台ModelArts

er,SharegptStyleInstructionHandler】需指定。 micro-batch-size 1 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
SFT全参微调训练 - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 HF_SAVE_DIR：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 HF_SAVE_DIR：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910）
执行训练任务（历史版本） - AI开发平台ModelArts

置训练作业开始时需要输入数据的路径和训练结束后输出数据的路径。输入指定的目录在训练开始时，平台会自动将指定的OBS路径下的文件copy到容器内输出指定的目录在训练过程中，平台会自动将容器内的文件copy到指定的OBS路径下在“输入”的输入框内设置变量：ORIGINAL_TR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 执行训练任务
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

-e . 开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

“包年/包月”，在页面左下角查看所需费用。计费周期包年/包月资源的计费周期是根据您购买的时长来确定的（以北京时间为准）。一个计费周期的起点是您开通或续费资源的时间（精确到秒），终点则是到期日的23:59:59。例如，如果您在2023/03/08 15:50:04购买了一个时

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
发布本地AI应用到AI Gallery - AI开发平台ModelArts

需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。指定时长：设置作业运行几小时后停止，当AI Gallery工具链服务运行时长达到指定时长时，系统将会暂停作业。时长设置不能超过计算资源的剩余额度。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
部署推理服务 - AI开发平台ModelArts

是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
查询服务监控信息 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 node_id 否 String 待查询的边缘节点ID，仅当infer_type为edge时可指定，默认查询所有节点。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得本次Token解码能与下一次模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
创建DevServer - AI开发平台ModelArts

取值范围为1~8。响应参数状态码： 200 表7 响应Body参数参数参数类型描述 create_at Long 创建时间。 update_at Long 更新时间。 charging_mode String 计费模式。 COMMON：同时支持包周期和按需 POST_PAID：按需模式

 帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
非分离部署推理服务 - AI开发平台ModelArts

是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 HF_SAVE_DIR：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
SFT全参微调训练 - AI开发平台ModelArts

OUTPUT_SAVE_DIR：训练完成后指定的输出模型路径。 HF_SAVE_DIR：训练完成的权重文件自动转换为Hugging Face格式权重输出的路径（确保添加CONVERT_MG2HF环境变量并设置为True）。分别单击“输入”和“输出”的数据存储位置，如图所示，选择OBS桶中指定的目录。ORI

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该功能会略微增加首Token时间，但可以提升推理吞吐量。 export DEFER_MS=10 # 延迟解码时间，默认值为10，单位为ms。将Token解码延迟进行的毫秒数，使得当次Token解码能与下一次模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

经包含了模型训练所有的依赖环境，因此可以将已经调测完成的开发环境保存成一个镜像。方式一：保存镜像需要指定镜像名称、镜像标签、SWR服务的组织等信息，保存镜像需要等待几分钟时间，期间不能对Notebook有额外操作。 SWR服务的组织可以在SWR服务中进行创建，也可以使用SDK创

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard开发环境

总条数： 1131

上一页
1
...
14
15
16
...
57
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SFT全参微调训练 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

查询样本列表 - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

执行训练任务（历史版本） - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用ModelArts VSCode插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线