检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用CloudShell或者其它SSH远程工具。
在过往性能调优场景中,如果性能profiling数据在OBS上,通常需要将TB或者GB级别的profiling数据下载至本地后才能使用msprof-analyze进行分析,大量数据的下载耗时以及对本地大规格存储盘的要求容易导致分析受阻。
SSH登录机器后,检查NPU卡状态。运行如下命令,返回NPU设备信息。
表55 JobEndpointsResp 参数 参数类型 描述 ssh SSHResp object SSH连接信息。 jupyter_lab JupyterLab object JupyterLab连接信息。
msprobe工具使用指导 msprobe API预检 msprobe精度比对 msprobe梯度监控 父主题: GPU业务迁移至昇腾训练推理
output = model_inference(input_data) # 保存网络输出节点名称、维度、shape及输出到本地文件。
的方式登录Server。
的方式登录服务器。
表56 JobEndpointsResp 参数 参数类型 描述 ssh SSHResp object SSH连接信息。 jupyter_lab JupyterLab object JupyterLab连接信息。
# 训练输出保存权重,目录结构会自动生成,无需用户创建 |── ${model_name} # 模型名称,根据实际训练模型创建,训练完成权重文件及日志目录 上传代码和权重文件到工作环境 使用root用户以SSH
# 训练输出保存权重,目录结构会自动生成,无需用户创建 |── ${model_name} # 模型名称,根据实际训练模型创建,训练完成权重文件及日志目录 上传代码和权重文件到工作环境 使用root用户以SSH
# 训练输出保存权重,目录结构会自动生成,无需用户创建 |── ${model_name} # 模型名称,根据实际训练模型创建,训练完成权重文件及日志目录 上传代码和权重文件到工作环境 使用root用户以SSH
线上开发:代码在云上,通过SSH连接容器。 图3 选择开发场景 图4 选择训练作业代码存储位置 鼠标放至作业列表处,单击作业列表旁边的打开创建训练作业页面。 图5 创建作业入口 (可选)设置中转目录:中转目录支持OBS路径和SFS盘挂载路径。
SSH登录机器后,检查NPU设备检查。运行如下命令,返回NPU设备信息。
SSH登录机器后,检查NPU卡状态。运行如下命令,返回NPU设备信息。
SSH登录机器后,检查NPU卡状态。运行如下命令,返回NPU设备信息。
SSH登录机器后,检查NPU卡状态。运行如下命令,返回NPU设备信息。
(仅支持jpeg格式数据),可加速数据读取,提升性能,默认启用。
在ModelArts运行态的Notebook容器中,采用动态挂载特性,将OBS对象存储模拟成本地文件系统。其本质是通过挂载工具,将对象协议转为POSIX文件协议。挂载后应用层可以在容器中正常操作OBS对象。
如果需要通过VS Code连接Notebook方式进行代码调试,则需开启“SSH远程开发”并选择密钥对,请参考VS Code连接Notebook方式介绍。 参数填写完成后,单击“立即创建”进行规格确认。 参数确认无误后,单击“提交”,完成Notebook的创建操作。