检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
msprobe API预检 msprobe是MindStudio Training Tools工具链下精度调试部分的工具包,主要包括精度预检、溢出检测和精度比对等功能,目前适配PyTorch和MindSpore框架。这些子工具侧重不同的训练场景,可以定位模型训练中的精度问题。 精
net.ipv4.ip_forward Step2 获取基础镜像 建议使用官方提供的镜像部署服务。镜像地址{image_url}参见表2。 docker pull {image_url} Step3 获取代码并上传 上传推理代码AscendCloud-AIGC-6.3.907-xxx
net.ipv4.ip_forward 步骤二:获取基础镜像 建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三:启动容器镜像 启动容器镜像,启动前可以根据实际需要增加修改参数。 docker run
基于官方提供的基础镜像构建自定义镜像sdxl-train:0.0.1。参考如下命令编写Dockerfile文件。镜像地址{image_url}请参见获取软件和镜像。 FROM {image_url} RUN mkdir /home/ma-user/sdxl-train && mkdir /ho
docker-engine.aarch64 docker-engine-selinux.noarch docker-runc.aarch64 配置IP转发,用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值,如果为1,可跳过此步骤。 sysctl -p |
msprobe工具使用指导 msprobe API预检 msprobe精度比对 msprobe梯度监控 父主题: GPU业务迁移至昇腾训练推理
net.ipv4.ip_forward 步骤二:获取基础镜像 建议使用官方提供的镜像部署服务。镜像地址{image_url}参见表2。 docker pull {image_url} 步骤三:启动容器镜像 启动容器镜像。启动前请先按照参数说明修改${}中的参数。 export w
net.ipv4.ip_forward 步骤二:获取基础镜像 建议使用官方提供的镜像部署服务。镜像地址{image_url}参见表2。 docker pull {image_url} 步骤三:启动容器镜像 启动容器镜像。启动前请先按照参数说明修改${}中的参数。 export w
net.ipv4.ip_forward 步骤二:获取基础镜像 建议使用官方提供的镜像部署服务。镜像地址{image_url}参见表2。 docker pull {image_url} 步骤三:启动容器镜像 启动容器镜像。启动前请先按照参数说明修改${}中的参数。 docker run
ipv4.ip_forward Step2 启动镜像 获取基础镜像。建议使用官方提供的镜像。镜像地址{image_url}参见获取软件和镜像。 docker pull {image_url} 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。 docker
net.ipv4.ip_forward 步骤二 获取基础镜像 建议使用官方提供的镜像部署推理服务。镜像地址{image_url}获取请参见表1。 docker pull {image_url} 步骤三 启动容器镜像 启动容器镜像,启动前可以根据实际需要增加修改参数。 docker run
ip_forward Step2 获取镜像 获取基础镜像。建议使用官方提供的镜像部署推理服务。镜像地址{image_url}参考获取镜像。 docker pull ${image_url} Step3 启动容器 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。
您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 镜像版本 本教程中用到基础镜像地址和配套版本关系如下表所示,请提前了解。 表2 基础容器镜像地址 配套软件版本 镜像用途 镜像地址 配套 获取方式 6.3.912版本 基础镜像 swr.cn-southwest-2.myhuaweicloud
net.ipv4.ip_forward 获取基础镜像。建议使用官方提供的镜像部署推理服务。镜像地址{image_url}参见表1:获取软件和镜像 docker pull {image_url} 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。 docker
net.ipv4.ip_forward Step2 获取基础镜像 建议使用官方提供的镜像部署服务。镜像地址{image_url}参见表2。 docker pull {image_url} Step3 启动容器镜像 启动容器镜像。启动前请先按照参数说明修改${}中的参数。 docker
connection_info字段数据结构说明 参数 参数类型 说明 protocol String 链接仓库协议。当前支持:ssh,https。 url String 链接仓库地址。 credential Object 证书信息,请参见表30。 表21 credential字段数据结构说明 参数 参数类型
镜像保存时报错“there are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes”或“Buildimge,False
ipv4.ip_forward Step2 启动镜像 获取基础镜像。建议使用官方提供的镜像。镜像地址{image_url}参见获取软件和镜像。 docker pull {image_url} 启动容器镜像。启动前请先按照参数说明修改${}中的参数。可以根据实际需要增加修改参数。训练默认使用单机8卡。
基于官方提供的基础镜像构建自定义镜像sdxl-train:0.0.1。参考如下命令编写Dockerfile文件。镜像地址{image_url}请参见获取软件和镜像。 FROM {image_url} RUN mkdir /home/ma-user/sdxl-train && mkdir /ho
图1 修改defaults.ini文件 其中: root_url的组成为:https:{jupyterlab域名}/{INSTANCE_ID}/grafana。域名和INSTANCE_ID可以从打开的jupyterLab页面地址栏获取,如下: Serve_from_sub_path设置为true