-
子用户使用专属资源池创建训练作业无法选择已有的SFS Turbo - AI开发平台ModelArts
子用户使用专属资源池创建训练作业无法选择已有的SFS Turbo 由于权限不足,导致子用户无法看到已有的SFS Turbo,请为子用户所在用户组添加SFS FullAccess 、SFS Trubo FullAccess权限。 父主题: 功能咨询
-
AIGC工具tailor使用指导 - AI开发平台ModelArts
AIGC工具tailor使用指导 tailor简介 tailor是AIGC场景下用于模型转换(onnx到mindir)和性能分析的辅助工具,当前支持以下功能。 表1 功能总览 功能大类 具体功能 模型转换 固定shape转模型 动态shape传入指定档位转模型 支持fp32 支持AOE优化
-
日志提示“No space left on device” - AI开发平台ModelArts
达到50G,只有默认的10GB,导致作业训练失败。 实际存储空间足够,却依旧报错“No Space left on device”。 同一目录下创建较多文件,为了加快文件检索速度,内核会创建一个索引表,短时间内创建较多文件时,会导致索引表达到上限,进而报错。 触发条件和下面的因素有关:
-
管理AI应用 - AI开发平台ModelArts
效。 删除AI应用 当AI应用不再使用时,支持删除,释放AI Gallery仓库的存储空间。 在AI应用详情页,选择“设置”页签。 确认AI应用状态是否为“运行中”。 是,则在“运行资源设置”处,单击“暂停”,停止AI应用再执行下一步。 否,则执行下一步。 在“删除AI应用”处,
-
部署AI Gallery模型为AI应用 - AI开发平台ModelArts
格说明。 AI应用封面图 否 上传一张AI应用封面图,AI应用创建后,将作为AI应用页签的背景图展示在AI应用列表。建议使用16:9的图片,且大小不超过7MB。 如果未上传图片,AI Gallery会为AI应用自动生成封面。 应用描述 否 输入AI应用的功能介绍,AI应用创建后,
-
作为调用发起方的客户端无法访问已经获取到的推理请求地址 - AI开发平台ModelArts
作为调用发起方的客户端无法访问已经获取到的推理请求地址 问题现象 完成在线服务部署且服务处于“运行中”状态后,已经通过调用指南页面的信息获取到调用的server端地址,但是调用发起方的客户端访问该地址不通,出现无法连接、域名无法解析的现象。 原因分析 在调用指南页签中显示的调用地
-
GPU裸金属服务器无法Ping通的解决方案 - AI开发平台ModelArts
GPU裸金属服务器无法Ping通的解决方案 问题现象 在华为云使用GPU裸金属服务器时, 服务器绑定EIP(华为云弹性IP服务)后,出现无法ping通弹性公网IP现象。 原因分析 查看当前GPU裸金属服务器的安全组的入方向规则的配置,发现仅开通了TCP协议的22端口。 ping命
-
AI应用 - AI开发平台ModelArts
AI应用 发布自定义AI应用 部署AI Gallery模型为AI应用 管理AI应用 父主题: AI Gallery(新版)
-
入驻AI Gallery - AI开发平台ModelArts
入驻AI Gallery 如果需要在AI Gallery中发布HiLens、报名实践活动或发布AI说,则需要先完成入驻AI Gallery。 如果没有入驻过AI Gallery,在报名实践活动或发布AI说时,将跳转至“欢迎入驻AI Gallery”页面。 在“欢迎入驻AI Gal
-
使用ModelArts时提示“权限不足”,如何解决? - AI开发平台ModelArts
使用ModelArts时提示“权限不足”,如何解决? 当您使用ModelArts时如果提示权限不足,请您按照如下指导对相关服务和用户进行授权,并对用户权限进行检查操作。 由于ModelArts的使用权限依赖OBS服务的授权,您需要为用户授予OBS的系统权限。 如果您需要授予用户关
-
使用AI案例 - AI开发平台ModelArts
使用AI案例 在AI Gallery中,您可以根据您的业务场景和诉求,查找并订阅相应的场景化AI案例。订阅后可以一键运行案例。 AI Gallery中分享的案例支持免费订阅,但在使用过程中如果消耗了硬件资源进行部署,管理控制台将根据实际使用情况收取硬件资源的费用。 前提条件 注册
-
创建AI应用 - AI开发平台ModelArts
创建AI应用 功能介绍 导入元模型创建AI应用。 执行代码、模型需先上传至OBS(训练作业生成的模型已默认存储到OBS)。 接口约束 使用模板导入模型与不使用模板导入这两类导入方式的Body参数要求不一样。以下Body参数说明中以模板参数表示适合使用模板导入模型时填写的参数,非模
-
日志提示"Permission denied" - AI开发平台ModelArts
日志提示"Permission denied" 问题现象 训练作业访问挂载的EFS,或者是执行.sh启动脚本时,出现如下错误: [Errno 13]Permission denied: '/xxx/xxxx' 图1 错误日志 bash: /bin/ln: Permission denied
-
AI诊断 - AI开发平台ModelArts
AI诊断 用户可以通过NCCl Test,测试节点GPU状态,并且测试多个节点间的通信速度。 操作步骤 单击资源池名称,进入资源池详情。 单击左侧“AI组件管理 > AI诊断”。 单击“诊断”,选择“日志上传路径”和NCCL Test节点,其余参数可保持默认值或根据实际需求修改。
-
训练作业访问OBS时,日志提示“stat:403 reason:Forbidden” - AI开发平台ModelArts
训练作业访问OBS时,日志提示“stat:403 reason:Forbidden” 问题现象 训练作业访问OBS时,出现如下报错: 图1 报错信息 原因分析 出现该问题的可能原因如下: OBS服务的权限出现问题,导致无法正常读取数据 处理方法 请检查OBS权限配置,如未解决问题
-
使用AI应用 - AI开发平台ModelArts
使用AI应用 模型部署为AI应用之后,可以直接使用AI应用。 登录AI Gallery。 选择“AI应用”,进入AI应用列表页。 在列表页,单击状态为“运行中”的AI应用,进入AI应用详情页。 在AI应用详情页使用AI应用。 父主题: 订阅使用
-
查看AI应用的事件 - AI开发平台ModelArts
查看操作 在ModelArts管理控制台的左侧导航栏中选择“AI应用”,在AI应用列表中,您可以单击AI应用名称,进入AI应用详情页面。 在AI应用详情页面,切换到“事件”页签,查看事件信息。 父主题: 管理AI应用
-
日志提示"write line error" - AI开发平台ModelArts
日志提示"write line error" 问题现象 在程序运行过程中,刷出大量错误日志"write line error"。并且问题是必现问题,每次运行到同一地方的时候,出现错误,具体见下面截图: 图1 错误日志 原因分析 出现该问题的可能原因如下: 程序运行过程中,产生了c
-
发布自定义AI应用 - AI开发平台ModelArts
格说明。 AI应用封面图 否 上传一张AI应用封面图,AI应用创建后,将作为AI应用页签的背景图展示在AI应用列表。建议使用16:9的图片,且大小不超过7MB。 如果未上传图片,AI Gallery会为AI应用自动生成封面。 应用描述 否 输入AI应用的功能介绍,AI应用创建后,
-
查看AI应用详情 - AI开发平台ModelArts
版本。 元模型存储路径 若元模型来源于对象存储服务,显示元模型的存放路径。 容器镜像存储路径 若元模型来源于容器镜像,显示容器镜像存储路径。 AI引擎 若元模型来源于训练作业/对象存储服务,显示AI应用使用的AI引擎。 引擎包地址 若元模型来源于对象存储服务(AI引擎为Custom),显示引擎包地址。