搜索_华为云

查看日志和性能 - AI开发平台ModelArts

loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。loss收敛图存放路径对应表1表格中output_dir参数值路径下的training_loss.png中也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
创建训练任务 - AI开发平台ModelArts

resnet50 -b 128 --epochs 5 dog_cat_1w/ 此处的“demo”为用户自定义的OBS存放代码路径的最后一级目录，可以根据实际修改。资源池：在“专属资源池”页签选择GPU规格的专属资源池。规格：选择单GPU规格。单击“提交”，在“信息确认”页面，确认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
查看日志和性能 - AI开发平台ModelArts

loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。loss收敛图存放路径对应表1表格中output_dir参数值路径下的training_loss.png中也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
训练作业进程异常退出 - AI开发平台ModelArts

仔细评估内存使用情况。退出码139 请排查安装包的版本，可能存在包冲突的问题。排查办法根据错误信息判断，报错原因来源于用户代码。您可以通过以下两种方式排查：线上环境调试代码（仅适用于非分布式代码）在开发环境（notebook）申请相同规格的开发环境实例。在noteb

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

线带宽不可以这么计算。如果Tree算法算出来的总线带宽相当于是相对Ring算法的性能加速。算法计算总耗时减少了，所以用公式算出来的总线带宽也增加了。理论上Tree算法是比Ring算法更优的，但是Tree算法对网络的要求比Ring高，计算可能不太稳定。 Tree算法可以用更少的数据通信量完成all

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
配置Lite Server网络 - AI开发平台ModelArts

单个弹性公网IP用于多个Server服务器：一个VPC配置一个EIP（弹性公网IP），通过NAT网关配置进行EIP资源共享，实现该VPC下的所有Server服务器均可以通过该EIP进行公网访问，Server服务器共享网络资源。单个弹性公网IP用于单个Server服务器登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
分离部署推理服务 - AI开发平台ModelArts

建议增加1个容器，也可以在全量推理或增量推理的容器上启动。前提条件已准备好DevServer环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。安装过程需要连接互联网git clone，确保容器可以访问公网。 Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
SDXL WebUI基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

容器名称，进入容器时会用到，此处可以自己定义一个容器名称，例如sdxl-diffusers。 --device=/dev/davinci3：挂载主机的/dev/davinci3到容器的/dev/davinci3。可以使用npu-smi info查看空闲卡号，修改davinci后数字可以更改挂载卡。 ${image_name}

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
返回结果 - AI开发平台ModelArts
返回结果 - AI开发平台ModelArts

对于获取用户Token接口，返回如图1所示的消息头。其中“x-subject-token”就是需要获取的用户Token。有了Token之后，您就可以使用Token认证调用其他API。图1 获取用户Token响应消息头响应消息体响应消息体通常以结构化格式返回，与响应消息头中Cont

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
在VS Code中上传下载文件 - AI开发平台ModelArts

#输入python并回车，进入python环境 python 然后参考文件传输进行OBS传输操作。下载Notebook中的文件至本地在Notebook中开发的文件，可以下载至本地。在本地IDE的Project目录下的Notebook2.0工程单击右键，单击“Download...”将文件下载到本地。图2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
查看ModelArts相关审计日志 - AI开发平台ModelArts

时间范围：可选择查询最近七天内任意时间段的操作事件。在需要查看的事件左侧，单击展开该事件的详细信息。单击需要查看的事件“操作”列的“查看事件”，可以在弹窗中查看该操作事件结构的详细信息。更多关于云审计服务事件结构的信息，请参见《云审计服务用户指南》。父主题：使用CTS审计ModelArts服务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用CTS审计ModelArts服务
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

Configuration。如果需要指定多个参数，可以使用--conf conf1 --conf conf2。 --resources Array of String 否资源包名称。支持本地文件，OBS路径及用户已上传到DLI资源管理系统的文件。如果需要指定多个参数，可以使用--resources resource1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
NPU日志收集上传 - AI开发平台ModelArts

npu_log_collection.execute() 执行脚本收集日志。在节点上执行该脚本，可以看到有如下输出，代表日志收集完成并成功上传至OBS。图2 日志收集完成查看在脚本的同级目录下，可以看到收集到的日志压缩包。图3 查看结果父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
数据准备使用流程 - AI开发平台ModelArts

量。帮助用户提高数据的质量。提供图像、文本、音频、视频等多种格式数据的预览，帮助用户识别数据质量。提供对数据进行多维筛选的能力，用户可以根据样本属性、标注信息等进行样本筛选。提供12+标注工具，方便用户进行精细化、场景化和专业化的数据标注。提供基于样本和标注结果进行特征分析，帮助用户整体了解数据的质量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
日志提示“No space left on device” - AI开发平台ModelArts

（ blocksize，系统默认 4096B。总共有三种大小：1024B、2048B、4096B）创建文件越快，越容易触发。处理方法可以参照日志提示"write line error"文档进行修复。如果是分布式作业有的节点有错误，有的节点正常，建议提工单请求隔离有问题的节点。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

包含在torch_npu包中。自动迁移工具使用指导训练业务代码适配昇腾PyTorch代码适配 PyTorch Analyse 迁移分析工具，可以使用工具扫描用户的训练脚本，识别出源码中不支持的torch API和cuda API信息。包含在cann toolkit中。分析工具使用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

[root@Server-ddff ~]# 发现和当前内核一致，因此即使reboot也不会更改服务器的内核版本。若希望升级指定的操作系统内核，也可以执行grub2-set-default进行设置默认启动内核版本。但操作系统内核升级可能带来的问题。例如在操作系统内核4.18.0-147.5

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
VS Code一键连接Notebook - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“开发空间 > Notebook”，进入“Notebook”页面。该界面显示已创建实例的状态为“运行中”。当前有两种方式，可以打开VS Code连接。方式一：单击“操作”列的“更多 > VS Code接入”。弹出“是否打开Visual Studio Code？”对话框。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
在推理生产环境中部署推理服务 - AI开发平台ModelArts

是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。 export USE_PFA_HIGH_PRECISION_MODE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查看AI应用列表 - AI开发平台ModelArts

部署：将AI应用发布为在线服务、批量服务或边缘服务。创建新版本：创建新的AI应用版本。参数配置除版本外，将默认选择上一个版本的配置信息，您可以对参数配置进行修改。删除：删除对应的AI应用。说明：如果AI应用的版本已经部署服务，需先删除关联的服务后再执行删除操作。AI应用删除后不可恢复，请谨慎操作。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 管理AI应用

总条数： 1316

上一页
1
...
61
62
63
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

训练作业进程异常退出 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

SDXL WebUI基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

返回结果 - AI开发平台ModelArts

在VS Code中上传下载文件 - AI开发平台ModelArts

查看ModelArts相关审计日志 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

日志提示“No space left on device” - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查看AI应用列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线