搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

ser用户执行后续命令。 docker exec -it ${container_name} bash 步骤四：下载依赖代码包并上传到宿主机下载华为侧插件代码包AscendCloud-AIGC-6.3.909-xxx.zip文件，获取路径参见表1。本案例使用的是解压到子目录/a

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

open(file_path, "r") as f: trainer_status = json.load(f) return trainer_status.get("log_history") def plot_curve(data_source: List[Dict]

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
删除训练作业 - AI开发平台ModelArts

删除训练作业示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式一：根据指定的job_id删除。 from modelarts.session import Session from

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

更多Screen使用说明可参考Screen User's Manual。通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。在ModelArts Standard控制台，选择“模型训练>训练作业”。在训练作业详情页面，选择Cloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

ma-user:ma-group ${container_work_dir} 此步骤可能需要密码或root权限 Step5 下载代码安装环境下载华为侧插件代码包AscendCloud-AIGC-6.3.908-xxx.zip文件，获取路径参见表1。 unzip AscendCloud-AIGC-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

com/v1/infers/f2682******f42" url = "在线服务的调用地址" # 认证用的app_key和app_secret硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全; # 本示例以app_key和app

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业 > 访问在线服务支持的认证方式
分离部署推理服务 - AI开发平台ModelArts

建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} Step3 上传代码包和权重文件上传安装依赖软件推理代码AscendCloud-LLM-6.3.908-xxx.zip和算子包AscendCloud-OPP-6.3.908-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三上传代码包和权重文件上传安装依赖软件推理代码AscendCloud-LLM-6.3.909-xxx.zip和算子包AscendCloud-OPP-6.3.909-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
推理服务测试 - AI开发平台ModelArts

推理服务测试推理服务在线测试支持文件、图片、json三种格式。通过部署为在线服务Predictor可以完成在线推理预测。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景：部署在线服务Predictor的推理预测

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

如果文件较大，可以保存成多个“.tar”包，在入口脚本中调用多进程进行并行解压数据。不建议把散文件保存到OBS上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import moxing as mox import os mox.file.copy_parallel("o

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

https://huggingface.co/runwayml/stable-diffusion-v1-5 -b onnx 图21 代码下载成功容器环境保存镜像。配置好环境后可以进行业务代码的开发调试。通常为了避免机器重启后环境丢失，建议将已经配好的环境保存成新的镜像，命令如下： # 查看需要保存为镜像的容器ID

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
用户AK-SK认证模式 - AI开发平台ModelArts

用户AK-SK认证模式本模式支持OBS管理、训练管理、模型管理、服务管理模块的鉴权。示例代码 1 2 from modelarts.session import Session session = Session(access_key='***',secret_key='***'

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

) return torch._C._cuda_getDeviceCount() > 0 False 原因分析 Error 802原因为缺少fabricmanager，可能由于以下原因导致nvidia-fabricmanager.servcie不工作：可能系统资源不足、如内存不足、内存泄露。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本教程案例是基于ModelArts Lite DevServer运行的，需要购买并开通DevServer资源。准备代码准备AscendSpeed训练代码、分词器Tokenizer和推理代码。准备数据准备训练数据，可以用本案使用的数据集，也可以使用自己准备的数据集。准备镜像准备训练模型适用的容器镜像。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
更新训练作业描述 - AI开发平台ModelArts

更新训练作业描述示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。方式一：根据指定的job_id更新。 from modelarts.session import Session from

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

8或950808）与我们联系。常见问题为什么要下线旧版自动学习？ ModelArts自动学习是帮助用户实现AI应用的低门槛、高灵活、零代码的定制化模型开发工具。ModelArts团队对自动学习模块进行了架构与前端页面的升级，新版自动学习已于2023年6月上线，并已作为主入口面

 帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

是MPI，训练使用的资源是CPU或GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux x86_64架构的主机，操作系统ubuntu-18.04，通过编写Dockerfile文件制作自定义镜像。目标：构建安装如下软件的容器镜像，并在ModelArts平台上

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

是MPI，训练使用的资源是CPU或GPU。本实践教程仅适用于新版训练作业。场景描述本示例使用Linux x86_64架构的主机，操作系统ubuntu-18.04，通过编写Dockerfile文件制作自定义镜像。目标：构建安装如下软件的容器镜像，并在ModelArts平台上

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例

总条数： 1334

上一页
1
...
50
51
52
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

SDXL ComfyUI插件基于DevServer适配PyTorch NPU推理指导（6.3.904） - AI开发平台ModelArts

删除训练作业 - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练微调指导（6.3.908） - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

训练作业使用MoXing拷贝数据较慢，重复打印日志 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

GPU A系列裸金属服务器无法获取显卡如何解决 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

更新训练作业描述 - AI开发平台ModelArts

【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线