搜索_华为云

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

获取SFS Turbo的挂载命令。进入弹性文件服务SFS管理控制台。选择“SFS Turbo”进入文件系统列表，单击文件系统名称，进入详情页面。在“基本信息”页签获取并记录“Linux挂载命令”。在ECS服务器中挂载NFS存储。首先保证对应目录存在，然后输入对应指令即可。命令参考：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

资源池工作空间迁移登录ModelArts管理控制台，选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。在资源池列表中，选择目标资源池右侧操作列的“ > 工作空间迁移”。在弹出的“迁移专属资源池”中，选择要迁移的“目标工作空间”，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
如何安装C++的依赖库？ - AI开发平台ModelArts

copy_parallel('obs://bucket-name/data', '/home/ma-user/work/data') 在Jupyter页面的“Files”页签下，单击“New”，打开“Terminal”。执行如下命令进入目标路径，确认源码已下载，即“data”文件是否存在。 cd

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

本文档适配昇腾云ModelArts 6.3.910版本，请参考表1获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。软件配套版本表1 获取软件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

dev_services Array of strings 镜像支持的服务。枚举值如下： NOTEBOOK：镜像支持通过https协议访问Notebook。 SSH：镜像支持本地IDE通过SSH协议远程连接Notebook。 id String 待创建Notebook实例的镜

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

-955-988或950808）与我们联系。常见问题为什么要下线模型转换？ ModelArts模型转换向AI开发者提供了便捷的模型转换页面，将Tensorflow和Caffe框架的模型格式转换为MindSpore的模型格式，即模型后缀为.om，使之能在昇腾硬件中进行推理。由于

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
使用MaaS压缩模型 - AI开发平台ModelArts

Qwen1.5-72B √ √ Qwen1.5-7B √ √ Qwen2-72B √ x Qwen2-72B-1K √ x 前提条件在“我的模型”页面存在已创建成功的模型。已准备好用于存放压缩后模型权重文件的OBS桶，OBS桶必须和MaaS服务在同一个Region下。创建压缩任务登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
更新服务配置 - AI开发平台ModelArts

pe为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 specification 是 String 资源规格，当前版本可选modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
上传本地文件至JupyterLab - AI开发平台ModelArts

ission denied。请依次排查：请确保读取的OBS桶和Notebook处于同一站点区域，例如：都在华北-北京四站点。不支持跨站点访问OBS桶。请确认操作Notebook的账号有权限读取OBS桶中的数据。具体请参见ModelArts中提示OBS路径错误。父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 准备工作
更新网络资源 - AI开发平台ModelArts

Turbo的连接状态信息。可选值如下： Active：SFS连通状态正常 Abnormal：SFS连通状态异常 ipAddr String SFS Turbo的访问地址。状态码： 400 表20 响应Body参数参数参数类型描述 error_code String ModelArts错误码。 error_msg

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
设置无条件自动重启 - AI开发平台ModelArts

情，具体请参见训练作业重调度。开启无条件自动重启开启无条件自动重启有2种方式：控制台设置或API接口设置。控制台设置在创建训练作业页面，开启“自动重启”开关，并勾选“无条件自动重启”，开启无条件自动重启。开启无条件自动重启后，只要系统检测到训练异常，就无条件重启训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

Windows：C:\Users\{{user}} macOS/Linux： Users/{{user}} 解决方法二：请检查文件和文件夹权限。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
代码运行常见错误 - AI开发平台ModelArts

代码运行常见错误 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？开发环境提示空间不足，如何解决？如何处理使用opencv.imshow造成的内核崩溃？使用Wind

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
代码运行故障 - AI开发平台ModelArts

Notebook运行代码报错，在'/tmp'中到不到文件 Notebook无法执行代码，如何处理？运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
训练作业容错检查 - AI开发平台ModelArts

用户可以在创建训练作业时通过设置自动重启的方式开启容错检查。使用ModelArts Standard控制台的创建训练作业页面设置自动重启：用户可以在控制台页面通过开关的方式开启自动重启。“自动重启”开关默认不开启，表示不做重新下发作业，也不会启用环境检测。打开开关后，允许设置重启次数为1~128次。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
查看日志和性能 - AI开发平台ModelArts

png中也可以使用可视化工具TrainingLogParser查看loss收敛情况，将trainer_log.jsonl文件长传至可视化工具页面，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在第一个节点上。图2 Loss收敛情况（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
使用SSH工具连接Notebook，服务器的进程被清理了，GPU使用率显示还是100% - AI开发平台ModelArts

使用SSH工具连接Notebook，服务器的进程被清理了，GPU使用率显示还是100% 原因是代码运行卡死导致被进程清理，GPU显存没有释放；或者代码运行过程中内存溢出导致程序被清理，需要释放下显存，清理GPU，然后重新启动。为了避免进程结束引起的代码未保存，建议您每隔一段时间保存下代码输出至OBS桶或者容器

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > Notebook实例常见错误
查看日志和性能 - AI开发平台ModelArts

png中也可以使用可视化工具TrainingLogParser查看loss收敛情况，将trainer_log.jsonl文件长传至可视化工具页面，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点训练：训练过程中的loss打印在第一个节点上。图2 Loss收敛情况（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）

总条数： 1231

上一页
1
...
41
42
43
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

迁移Standard专属资源池和网络至其他工作空间 - AI开发平台ModelArts

如何安装C++的依赖库？ - AI开发平台ModelArts

Open-Sora1.2基于DevServer适配PyTorch NPU训练推理指导（6.3.910） - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

更新网络资源 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

报错“Permissions for 'x:/xxx.pem' are too open”如何解决？ - AI开发平台ModelArts

代码运行常见错误 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

使用SSH工具连接Notebook，服务器的进程被清理了，GPU使用率显示还是100% - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线