-
开发环境提示空间不足,如何解决? - AI开发平台ModelArts
当提示空间不足时,推荐使用EVS类型的Notebook实例。 参考如何在Notebook中上传下载OBS文件?操作指导,针对原有的Notebook,首先将代码和数据上传至OBS桶中。然后创建一个EVS类型的Notebook,将此OBS中的文件下载至Notebook本地(指新建的EVS类型Notebook)。
-
GP Ant8裸金属本地磁盘合并挂载至指定目录并设置开机启动自动挂载 - AI开发平台ModelArts
设置“setup.sh”为可执行文件。 chmod +x setup.sh 执行脚本 ./setup.sh 图2 脚本执行结果 父主题: DevServer资源使用
-
如何在容器中安装依赖包 - AI开发平台ModelArts
包。 pip install -r requirements.txt 安装成功后的示意图如图1所示。 图1 依赖包安装成功 父主题: 常见问题
-
GPU A系列裸金属服务器无法获取显卡问题解决方法 - AI开发平台ModelArts
GPU A系列裸金属服务器无法获取显卡问题解决方法 问题现象 在A系列裸金属服务器上使用PyTorch一段时间后,出现获取显卡失败的现象,报错如下: > torch.cuda.is_available() /usr/local/lib/python3.8/dist-package
-
GPU A系列裸金属服务器RoCE带宽不足问题解决方法 - AI开发平台ModelArts
GPU A系列裸金属服务器RoCE带宽不足问题解决方法 问题现象 GP Ant8支持RoCE网卡, Ubuntu20.04场景,在进行nccl-tests时,总线带宽理论峰值可达90GB/s,但实际测试下来的结果只有35GB/s。 原因分析 “nv_peer_mem”是一个Lin
-
AOE的自动性能调优使用上完全没有效果怎么办? - AI开发平台ModelArts
AOE的自动性能调优使用上完全没有效果怎么办? 在MindSpore Lite Convertor2.1版本之前可能出现的调优不生效的场景,建议直接使用MindSpore Lite Convertor2.1及以后的版本。配置文件指定选项进行AOE调优。使用转换工具配置config
-
实时同步用户所有DevServer实例状态 - AI开发平台ModelArts
实时同步用户所有DevServer实例状态 功能介绍 实时同步用户所有DevServer实例状态。 接口约束 暂无约束 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI
-
什么是区域、可用区? - AI开发平台ModelArts
我们用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region):从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region,通用Region指面向公共租户提
-
查询用户所有DevServer实例列表 - AI开发平台ModelArts
查询用户所有DevServer实例列表 功能介绍 查询用户所有DevServer实例列表。 接口约束 暂无约束。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET
-
访问容器目录时提示Permission denied - AI开发平台ModelArts
rmission denied。可以在宿主机中对相关目录做权限放开,执行命令如下。 chmod 777 -R ${dir} 父主题: 常见问题
-
GP Vnt1裸金属本地磁盘合并挂载至指定目录并设置开机启动自动挂载 - AI开发平台ModelArts
文件末尾一行填写以下内容: UUID=上一步查询出的UUID值1 /home/data xfs defaults 0 0 父主题: DevServer资源使用
-
训练时报“EI0006: Getting socket times out” - AI开发平台ModelArts
在启动训练任务前执行,在容器内设置HCCL通讯超时时间。 export HCCL_CONNECT_TIMEOUT=7200 父主题: 常见问题
-
查看CPU - AI开发平台ModelArts
uniq 查看逻辑CPU,使用如下命令: cat /proc/cpuinfo | grep 'processor' | wc -l 父主题: DevServer资源使用
-
环境准备 - AI开发平台ModelArts
1-py_3.9-euler_2.10.7-aarch64-snt9b”。 类型:Ascend。 规格:选择snt9b资源。 存储配置:云硬盘EVS。 磁盘规格:按照对应的存储使用情况可选择存储大小。 SSH远程开发:如果需通过VS Code远程连接Notebook实例,可打开SSH远程开发,并选择自己的密钥对。
-
ModelArts计费模式概述 - AI开发平台ModelArts
按照订单的购买周期结算。 后付费 按照云服务器实际使用时长计费。 计费周期 按订单的购买周期计费。 秒级计费,按小时结算。 适用计费项 计算资源 计算资源、云硬盘 适用资源池 专属资源池 公共资源池、专属资源池 适用功能模块 自动学习、Workflow、Notebook、模型训练、服务部署 自动学习
-
权限问题 - AI开发平台ModelArts
权限问题 训练作业访问OBS时,日志提示“stat:403 reason:Forbidden” 日志提示"Permission denied" 父主题: 训练作业
-
通用问题 - AI开发平台ModelArts
通用问题 ModelArts中提示OBS路径错误 进行OBS操作时,出现Error: 403 Forbidden错误?
-
准备工作 - AI开发平台ModelArts
在左侧导航栏中,选择“专属资源池 > 弹性裸金属”,进入“DevServer”列表。 单击“创建”,进入“创建DevServer”页面。 单击“新建密钥对”。 在新页面中单击右上角“创建密钥对”后,单击“确定”,并将密钥对保存至本地。 图6 创建密钥对 父主题: DevServer资源开通
-
启动/停止实例 - AI开发平台ModelArts
/停止失败”状态的弹性裸金属可以执行停止操作。 停止服务器为“强制关机”方式,会中断您的业务,请确保服务器上的文件已保存。 父主题: DevServer资源使用
-
部署推理服务 - AI开发平台ModelArts
部署推理服务 本章节介绍如何启动推理服务。 前提条件 已准备好DevServer环境。推荐使用“西南-贵阳一”Region上的DevServer和昇腾Snt9b资源。 确保容器可以访问公网。 Step1 检查环境 SSH登录机器后,检查NPU设备检查。运行如下命令,返回NPU设备信息。