-
场景介绍 - AI开发平台ModelArts
场景介绍 方案概览 本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件,为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。 本方案目前仅适用于部分企业客户,完成本方案的部署,需要先联系您所在企业的华为方技术支持。
-
导入AI应用对于镜像大小限制 - AI开发平台ModelArts
导入AI应用对于镜像大小限制 问题现象 用户在导入AI应用后,部署服务时,提示磁盘空间不足:“No space left on device”。 原因分析 ModelArts部署使用的是容器化部署,容器运行时有空间大小限制,当用户的模型文件或者其他自定义文件,系统文件超过Docker
-
查询团队标注的样本信息 - AI开发平台ModelArts
9:自由格式 score String 综合评分,用于团队标注。 source String 样本数据源地址。 sub_sample_url String 子样本URL,用于医疗。 worker_id String 团队标注人员的ID,用于团队标注。 表4 HardDetail 参数 参数类型
-
获取Execution列表 - AI开发平台ModelArts
"value" : { "object_type" : [ "DIRECTORY" ], "obs_url" : "/test-crq/train_output/" } } ], "outputs" : [
-
数据准备简介 - AI开发平台ModelArts
delArts数据管理。 提供多种数据接入方式,支持用户从OBS,MRS,DLI以及DWS等服务导入用户的数据。 提供18+数据增强算子,帮助用户扩增数据,增加训练用的数据量。 帮助用户提高数据的质量。 提供图像、文本、音频、视频等多种格式数据的预览,帮助用户识别数据质量。 提供
-
查询模型对象列表 - AI开发平台ModelArts
在ModelArts Notebook平台,Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。 场景1:查询当前用户所有模型对象 1 2 3 4 5 6 from modelarts.session import Session from modelarts
-
上传本地超大文件(5GB以上)至JupyterLab - AI开发平台ModelArts
ission denied。请依次排查: 请确保读取的OBS桶和Notebook处于同一站点区域,例如:都在华北-北京四站点。不支持跨站点访问OBS桶。 请确认操作Notebook的账号有权限读取OBS桶中的数据。 具体请参见ModelArts中提示OBS路径错误。 父主题: 上传本地文件至JupyterLab
-
获取项目ID和名称 - AI开发平台ModelArts
name)的步骤如下: 注册并登录管理ModelArts控制台。 在页面右上角单击用户名,然后在下拉列表中单击“我的凭证”,进入“我的凭证”页面。 如果您登录的是华为云官网,而非管理控制台。在单击用户名后,选择下拉列表中的“帐号中心”,然后单击“管理我的凭证”进入“我的凭证”页面。
-
推理基础镜像列表 - AI开发平台ModelArts
推理基础镜像列表 ModelArts的推理平台提供了一系列的基础镜像,用户可以基于这些基础镜像构建自定义镜像,用于部署推理服务。 X86架构(CPU/GPU)的推理基础镜像 表1 TensorFlow AI引擎版本 支持的运行环境 URI 2.1.0 CPU GPU(cuda10
-
训练容错检查 - AI开发平台ModelArts
预检失败&硬件正常 场景三:环境预检测成功并进入用户业务阶段,硬件检测出现故障并且用户业务非正常退出,系统隔离所有故障节点并重新下发训练作业。 图3 业务失败&硬件故障 场景四:环境预检测成功并进入用户业务阶段,硬件无故障,当用户业务异常时系统以失败状态结束作业。 图4 业务失败&硬件正常
-
开发环境计费项 - AI开发平台ModelArts
在ModelArts开发环境中运行Notebook实例时,会使用计算资源和存储资源,会产生计算资源和存储资源的累计值计费。具体内容如表1所示。 Notebook实例停止运行时,EVS还会持续计费,需及时删除才能停止EVS计费。 计算资源费用: 如果运行Notebook实例时,使用专属资源池进行模型训练和推理,计算资源不计费。
-
资源池驱动升级 - AI开发平台ModelArts
Ascend资源。 对于逻辑资源池,需要开启节点绑定后才能进行驱动升级,请提交工单联系华为工程师开启节点绑定。 驱动升级操作 登录ModelArts管理控制台,在左侧导航栏中选择“专属资源池 > 弹性集群”,默认进入“资源池”页面。 在资源池列表中,选择需要进行驱动升级的资源池“操作
-
管理和查看数据处理任务 - AI开发平台ModelArts
管理和查看数据处理任务 登录ModelArts管理控制台,在左侧的导航栏中选择“数据管理>数据处理”,进入“数据处理”页面。 在数据处理列表中,单击数据处理任务名称,进入数据处理任务的版本管理页面。您可以在该页面进行数据处理任务的“修改”与“删除”。 当已有的数据处理任务不再使用时,您可以删除数据处理任务。
-
资源池创建失败的原因与解决方法? - AI开发平台ModelArts
本文主要介绍在ModelArts资源池创建失败时,如何查找失败原因,并解决问题。 问题定位 您可以参考以下步骤,查看资源池创建失败的报错信息,并根据相应的解决方法解决问题: 登录ModelArts控制台,单击弹性集群,单击资源池列表上方的“操作记录”查看创建失败的资源池。 单击“操作记录”中失败状态的报错信息。 图1
-
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts
在服务器(ModelArts Lite云服务器或者是本地Windows/Linux等服务器)上登录Gallery CLI配置工具后,通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。 命令说明 登录Gallery CLI配置工具后,使用命令“gallery-cli download
-
昇腾迁移快速入门案例 - AI开发平台ModelArts
磁盘规格:按照对应的存储使用情况可选择存储大小。 SSH远程开发:如果需通过VS Code远程连接Notebook实例,可打开SSH远程开发,并选择自己的密钥对。 图2 实例创建 在Notebook列表,单击“操作列”的“打开”,打开Notebook示例。 图3 运行实例 图4 线上Notebook入口
-
使用pip install时出现“没有空间”的错误 - AI开发平台ModelArts
使用pip install时出现“没有空间”的错误 问题现象 在Notebook实例中,使用pip install时,出现“No Space left...”的错误。 解决办法 建议使用pip install --no-cache ** 命令安装,而不是使用pip install
-
更多功能咨询 - AI开发平台ModelArts
在Notebook中如何查看GPU使用情况 如何在代码中打印GPU使用信息 Ascend上如何查看实时性能指标? 不启用自动停止,系统会自动停掉Notebook实例吗?会删除Notebook实例吗? JupyterLab目录的文件、Terminal的文件和OBS的文件之间的关系 ModelArts中创建的数据集,如何在Notebook中使用
-
创建网络 - AI开发平台ModelArts
创建网络 登录ModelArts管理控制台,在左侧导航栏中选择“专属资源池 > 弹性集群”,默认进入“资源池”页面。 切换到“网络”页签,单击“创建”,弹出“创建网络”页面。 图1 网络列表 在“创建网络”弹窗中填写网络信息。 网络名称:创建网络时默认生成网络名称,也可自行修改。
-
通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题 - AI开发平台ModelArts
代码分析定位卡死问题 使用场景 本文指导用户通过py-spy工具分析卡死进程的调用栈并结合代码分析定位卡死问题。 操作步骤 在ModelArts控制台,选择“训练管理>训练作业”。 在训练作业详情页面,选择Cloud Shell页签,登录训练容器(训练作业需处于运行中)。 安装py-spy工具。