搜索_华为云

准备Notebook - AI开发平台ModelArts

登录ModelArts控制台，在贵阳一区域，进入开发环境的Notebook界面，单击右上角“创建”，创建一个开发环境。创建Notebook的详细介绍可以参考创建Notebook实例，此处仅介绍关键步骤。创建Notebook时，选择自定义镜像，并选择Step8 注册镜像章中注册的镜像。图1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
准备Notebook - AI开发平台ModelArts

登录ModelArts控制台，在贵阳一区域，进入开发环境的Notebook界面，单击右上角“创建”，创建一个开发环境。创建Notebook的详细介绍可以参考创建Notebook实例，此处仅介绍关键步骤。图1 创建Notebook 创建Notebook时，选择自定义镜像，并选择Step8 注册镜像章中注册的镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
开启训练故障自动重启功能 - AI开发平台ModelArts

kpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优化器状态、调度器状态）。即便模型训练中断，也可以基于checkpoint接续训练。当训练作业发生故障中断本次作业时，代码可自动从训练中断的位置接续训练，加载中断生成的checkpoin

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

backend service due to connection refused. " 出现该报错有两种情况：流量超过了模型的处理能力。可以考虑降低流量或者增加模型实例数量。镜像自身有问题。需要单独运行镜像确保镜像本身能正确提供服务。 "error_msg"："Due to self

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
录制Profiling - AI开发平台ModelArts

Profiler接口可全面采集PyTorch训练场景下的性能数据，主要包括PyTorch层算子信息、CANN层算子信息、底层NPU算子信息、以及算子内存占用信息等，可以全方位分析PyTorch训练时的性能状态。录制命令如下：在启动训练脚本基础上Step3 启动训练脚本新加DO_PROFILER=1和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号 vscode-server相关问题也可以使用上述的解决方法。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
远程连接处于retry状态如何解决？ - AI开发平台ModelArts

IdentityFile：本地密钥路径 - User：用户名，例如：ma-user - HostName：IP地址 - Port：端口号 vscode-server相关问题也可以使用上述的解决方法。父主题： VS Code连接开发环境失败常见问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

号是IAM用户或其他场景时，请参见《OBS权限配置指南》> 典型场景配置案例，查找授予OBS桶权限的指导。获得OBS桶的读写权限后，您可以在Notebook中，使用moxing接口，访问对应的OBS桶，并读取数据。举例如下： import moxing as mox mox.file

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
提交训练作业时，出现xxx isn't existed in train_version错误 - AI开发平台ModelArts

Configuration”，找到作业名称，单击右上角的减号并确认删除。图2 删除配置信息在弹出的确认对话框中，确认信息无误后，单击“是”删除对应配置信息。删除后您可以创建新的训练作业配置并提交训练作业。父主题： PyCharm Toolkit使用

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

my-task-image:latest # 替换为实际使用的镜像备注：业务负载和自定义指标采集可以共用一个容器，也可以由SideCar容器采集指标数据，然后将自定义指标采集容器指定到SideCar容器，这样可以不占用业务负载容器的资源。自定义指标数据格式自定义指标数据的格式必须是符合open

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
管理ModelArts服务的委托授权 - AI开发平台ModelArts

"ma_agency_iam-user01" } ], "total_count": 2 } 根据响应可以了解用户的授权信息。在管理用户授权时，可以调用删除授权接口删除指定用户的授权或者删除全量用户的授权。请求消息体： URI：DELETE https://{e

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
通过OBS导入AI应用时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志？ - AI开发平台ModelArts

控制台。当前推理基础镜像使用的python的logging模块，采用的是默认的日志级别Warnning，即当前只有warning级别的日志可以默认查询出来。如果想要指定INFO等级的日志能够查询出来，需要在代码中指定logging的输出日志等级为INFO级别。处理方法在推理代

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

在代码目录下提供安装文件如果使用“我的算法”创建训练作业，则在创建算法时，可以把相关文件放置在配置的“代码目录”下，算法的“启动方式”必须选择“预置框架”。如果使用“自定义算法”创建训练作业，则可以把相关文件放置在配置的“代码目录”下，“启动方式”必须选择“预置框架”。需要

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。不限时长：不限制作业的运行时长，AI Gallery工具链服务部署完成后将一直处于“运行中”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
使用CES监控Lite Server资源 - AI开发平台ModelArts

外，目前还支持Ubuntu20.04。监控指标采样周期1分钟。当前监控指标项已经包含CPU、内存、磁盘、网络。在主机上安装加速卡驱动后，可以自动采集的如下指标：表1 指标列表指标英文名指标中文名说明单位维度 gpu_status gpu健康状态。 BMS上GPU健康

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
预置图像处理模式 - AI开发平台ModelArts

该模式下的推理方式均为输入一张待处理图片，响应的“JSON”根据模型改变而改变。示例如下：页面预测 Postman调REST接口预测部署上线成功后，您可以从服务详情页的调用指南中获取预测接口地址。选择“Body”设置请求体，“key”选择为“images”，选择为“File”类型，接着通过选

 帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 推理规范说明 > 模型模板 > 输入输出模式说明
日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

version 原因分析出现该问题的可能原因如下： conda和pip包混装，有一些包卸载不掉。处理方法参考如下代码，三步走。先卸载numpy中可以卸载的组件。删除你环境中site-packages路径下的numpy文件夹。重新进行安装需要的版本。 import os os.system("pip

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
通过自定义镜像创建AI应用失败 - AI开发平台ModelArts

到SWR检查下对应的镜像是否存在，对应镜像的镜像地址是否和实际地址一致，大小写，拼写等是否一致。检查用户给ModelArts的委托中是否有SWR的权限，可以在权限管理中查看对应用户的授权内容，查看授权详情。如果没有对应权限，需要到统一身份认证服务给对应委托中加上对应权限。图1 权限管理图2

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件用户需有一定的Java开发经验，熟悉jar打包流程。用户需了解WebSocket协议的基本概念及调用方法。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 1367

上一页
1
...
62
63
64
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备Notebook - AI开发平台ModelArts

准备Notebook - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

在线服务预测报错ModelArts.4302 - AI开发平台ModelArts

录制Profiling - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

远程连接处于retry状态如何解决？ - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？ - AI开发平台ModelArts

提交训练作业时，出现xxx isn't existed in train_version错误 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

使用AOM看Lite Cluster监控指标 - AI开发平台ModelArts

管理ModelArts服务的委托授权 - AI开发平台ModelArts

通过OBS导入AI应用时，如何编写打印日志代码才能在ModelArts日志查询界面看到日志？ - AI开发平台ModelArts

训练模型时引用依赖包，如何创建训练作业？ - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

预置图像处理模式 - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

通过自定义镜像创建AI应用失败 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线