搜索_华为云

查看日志和性能 - AI开发平台ModelArts

r查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在第一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
查看日志和性能 - AI开发平台ModelArts

r查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在第一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
扩缩容Standard专属资源池 - AI开发平台ModelArts

方式二：单击某个资源池操作列的“扩缩容”（如果为包周期资源池，按钮为“扩容”），修改容器引擎空间大小（仅作用在新建节点上）。存量节点不支持修改容器引擎空间大小，仅作用在新建节点上，且会导致资源池内该规格下节点的dockerBaseSize不一致，可能会使得部分任务在不同节点的运行情况不一致。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
查看日志和性能 - AI开发平台ModelArts

查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
查看日志和性能 - AI开发平台ModelArts

查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
通过OBS创建AI应用时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

的pip下载了python3的包。具体基础镜像运行环境请参见推理基础镜像列表。安装pip包有先后依赖关系。处理方法到pypi.org上查询依赖的待安装包是否存在，如果不存在则建议使用whl包进行安装（将待安装的whl包放到模型所在的OBS目录下）。查看待安装包的安装限制和前置依赖等，排查是否满足相关要求。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
管理开发环境实例 - AI开发平台ModelArts

响应参数参数参数类型说明 current_status String 实例当前状态。 previous_state String 实例上一状态。请求示例如下以启动实例ID为“6fa459ea-ee8a-3ca4-894e-db77e160355e”的实例为例。 {

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查看日志和性能 - AI开发平台ModelArts

查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
查看日志和性能 - AI开发平台ModelArts

查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
查看日志和性能 - AI开发平台ModelArts

查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在最后一个节点上。图2 Loss收敛情况（示意图）父主题：主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905）
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

api_method String 请求方式包含GET、POST、PUT、DELETE、HEAD、PATCH、OPTIONS、ANY，固定返回ANY。 api_name String API名称。 api_remark String API描述。字符长度不超过255。 auth_type

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

SDK版本说明表1 ModelArts SDK版本说明发布时间版本号说明 2023-04 1.4.18 1.4.18版本在SDK旧版本基础上优化集成，主要新增DLI Spark任务提交能力，支持服务部署到推理新版专属资源池。支持的区域当前支持的“region_name”包括华

 帮助中心 > AI开发平台ModelArts > SDK参考
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

suppressed"日志。这个日志只是说明某个IO处理时间超过 1 分钟了，不会造成数据丢失。客户端有重试机制，等峰值过去后，所有IO最终都会正确处理。所以理论上，出现该错误日志，并不会造成数据丢失，只是SFS客户端I/O速度变慢或卡顿，但最终会争取处理。处理方法结合当前购买的SFS盘性能规划业务，

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
查询资源规格列表 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 continue 否 String 分页查询时上一页位置。 labelSelector 否 String 标签筛选。 limit 否 Integer 分页数目。请求参数无响应参数状态码：

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查看日志和性能 - AI开发平台ModelArts

jsonl文件长传至可视化工具页面，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在第一个节点上。图2 Loss收敛情况（示意图） ppo训练结束不会打印性能。建议根据保存路径下的trainer_log.jsonl文件的最后一行总的训练steps和时间来判断性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
查看AI应用事件 - AI开发平台ModelArts

方便用户更清楚的了解创建AI应用过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：事件类型事件信息（“XXX”表示占位符，以实际返回信息为准）解决方案正常开始导入模型。 Start model import. - 异常构建镜像失败。 Failed to build

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理AI应用
数据准备使用流程 - AI开发平台ModelArts

ModelArts数据准备全流程 ModelArts数据管理为用户准备高质量的AI数据提供了以下主要能力：解决用户获取数据的问题。用户可在AI Gallery上一键下载需要的数据资源到ModelArts数据管理。提供多种数据接入方式，支持用户从OBS，MRS，DLI以及DWS等服务导入用户的数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
SD WebUI推理方案概览 - AI开发平台ModelArts

DevServer或ModelArts Standard专属资源池的资源：使用Ascend Snt9B单机单卡规格。推荐使用“西南-贵阳一”Region上的昇腾资源。软件配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址插件代码包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

后续操作：清除相应资源在完成预测之后，建议关闭服务，以免产生不必要的计费。停止运行服务预测完成后，单击页面右上角的“停止”，即可停止该服务。单击左上角返回在线服务，在对应的服务名称所在行，单击选择操作列的“更多>停止”，停止该服务。图7 停止服务清除OBS中的数据。在控制台左侧导航栏的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习

总条数： 943

上一页
1
...
42
43
44
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

通过OBS创建AI应用时，构建日志中提示pip下载包失败 - AI开发平台ModelArts

管理开发环境实例 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查询API - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看AI应用事件 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

SD WebUI推理方案概览 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线