-
准备代码 - AI开发平台ModelArts
软件包名称中的xxx表示时间戳。 包含了本教程中使用到的模型训练代码。代码包具体说明请参见模型软件包结构说明。 获取路径:Support-E 请联系您所在企业的华为方技术支持下载获取。 模型软件包结构说明 AscendCloud-3rdLLM代码包结构介绍如下,训练脚本以分类的方式集中在scripts文件夹中:
-
以PyTorch框架创建训练作业(新版训练) - AI开发平台ModelArts
iam_endpoint为IAM的终端节点。 user_name为IAM用户名。 user_password为用户登录密码。 domain_name为用户所属的帐号名。 cn-north-1为项目名,代表服务的部署区域。 返回状态码“201 Created”,在响应Header中
-
昇腾云服务6.3.T061版本说明 - AI开发平台ModelArts
zip 包含 1. 三方大模型训练和推理代码包 2. 算子依赖包 获取路径:Support-E 说明: 如果没有下载权限,请联系您所在企业的华为方技术支持下载获取。 支持的特性 表1 本版本支持的特性说明 分类 软件包特性说明 参考文档 三方大模型,包名:AscendCloud-3rdLLM
-
WebSocket访问在线服务 - AI开发平台ModelArts
立WebSocket连接。 图2 获取API接口调用公网地址 如果信息正确,右下角连接状态处会显示:CONNECTED; 如果无法建立连接,如果是401状态码,检查认证信息; 如果显示WRONG_VERSION_NUMBER等关键字,检查自定义镜像的端口和ws跟wss的配置是否正确。
-
配置Grafana数据源 - AI开发平台ModelArts
n的项目id,通过“我的凭证”获取。 图3 进入我的凭证 图4 获取项目ID 在Grafana中增加数据源。 登录Grafana。首次登录用户名和密码为admin,登录成功后可根据提示修改密码。 在左侧菜单栏,选择“Configuration > Data Sources”,单击“Add
-
自动学习模型训练图片异常? - AI开发平台ModelArts
训练结果为图片异常。针对不同的异常情况说明及解决方案参见表1。 表1 自动学习训练中图片异常情况说明(图像分类和物体检测) 序号 图片异常显示字段 图片异常说明 解决方案字段 解决方案说明 1 load failed 图片无法被解码且不能修复 ignore 系统已自动过跳过这张图片,不需要用户处理。
-
使用ma-cli image get-template命令查询镜像构建模板 - AI开发平台ModelArts
根据模板名称关键字过滤模板列表。 -pn / --page-num Int 否 镜像页索引,默认是第1页。 -ps / --page-size Int 否 每页显示的镜像数量,默认是20。 示例 查看镜像构建模板。 ma-cli image get-template 父主题: 使用ma-cli image构建镜像
-
在线服务处于运行中状态时,如何填写推理请求的request header和request body - AI开发平台ModelArts
人员非法调用。所以在预测请求的header信息中包含的是调用者的身份信息,在body部分是需要进行预测的内容。 header的部分需要按照华为云的相关机制进行认证,body部分需要根据模型的要求如前处理脚本的要求,如自定义镜像的要求进行输入。 处理方法 Header: 在调用指南
-
在Notebook上安装配置Grafana - AI开发平台ModelArts
打开Grafana页面。 新打开一个浏览器窗口,在地址栏输入3中配置的root_url后。出现Grafana登录页面即代表在Notebook中安装和配置Grafana成功。首次登录用户名和密码为admin,登录成功后请根据提示修改密码。 父主题: 安装配置Grafana
-
节点池管理 - AI开发平台ModelArts
仅对新增的节点(扩容或重置生效),存量节点配置保持不变。 图2 更新节点池 删除节点池 当有多个节点池时,支持删除节点池,此时在操作列会显示“删除”按钮,单击“删除”后输入“DELETE”并单击“确定”即可。 每个资源池至少需要有一个节点池,当只有一个节点池时不支持删除。 父主题:
-
更新团队标注任务 - AI开发平台ModelArts
0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status 否 Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time 否 Long 更新时间。 worker_id 否 String
-
如何通过训练日志定位问题 - AI开发平台ModelArts
训练故障识别 ModelArts会对部分常见训练错误给出分析建议,目前还不能识别所有错误,提供的失败可能原因仅供参考。针对分布式作业,只会显示当前节点的一个分析结果,作业的失败需要综合各个节点的失败原因做一个综合判断。 常见训练问题定位思路如下: 根据日志界面提示中提供的分析建议解决。
-
查询所有团队的标注成员列表 - AI开发平台ModelArts
0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time Long 更新时间。 worker_id String
-
访问在线服务(Token认证) - AI开发平台ModelArts
epal_length”、“sepal_width”等。 参数填写完成,单击“send”发送请求,结果会在“Response”下的对话框里显示。 文件输入形式的预测结果样例如图6所示,返回结果的字段值根据不同AI应用可能有所不同。 文本输入形式的预测结果样例如图7所示,请求体包含
-
查询标注团队的成员列表 - AI开发平台ModelArts
0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time Long 更新时间。 worker_id String
-
创建团队标注任务 - AI开发平台ModelArts
0:打标者 1:审核者 2:团队管理者 3:数据集拥有者 status 否 Integer 标注成员的当前登录状态。可选值如下: 0:未发送邀请邮件 1:已发送邀请邮件但未登录 2:已登录 3:标注成员已删除 update_time 否 Long 更新时间。 worker_id 否 String
-
部署在线服务 - AI开发平台ModelArts
Service,并且提供在线的测试UI与监控能力,服务一直保持运行。 batch为批量服务,批量服务可对批量数据进行推理,完成数据处理后自动停止。 edge表示边缘服务,通过华为云智能边缘平台,在边缘节点将模型部署为一个Web Service,需提前在IEF(智能边缘服务)创建好节点。 vpc_id 否 String
-
使用ma-cli dli-job get-queue命令查询DLI 队列 - AI开发平台ModelArts
指定查询的DLI队列tags。 -pn / --page-num Int 否 DLI队列页索引,默认是第1页。 -ps / --page-size Int 否 每页显示的DLI队列数量,默认是20。 示例 查询队列名为“dli_ma_notebook”的队列信息。 ma-cli dli-job get-queue
-
同步裸金属服务器状态 - AI开发平台ModelArts
同步裸金属服务器状态 当用户在云服务器页面修改了裸金属服务器状态后,可同步其状态至ModelArts的弹性裸金属实例。 登录ModelArts管理控制台。 在左侧导航栏中,选择“专属资源池 > 弹性裸金属”,进入“弹性裸金属”列表页面。 在弹性裸金属列表中,单击操作列的“同步”,
-
创建AI应用失败,如何定位和处理问题? - AI开发平台ModelArts
原因,根据构建失败的原因进行排查处理。 图1 查看构建日志 常见问题 模型文件目录下不能出现dockerfile文件; “查看构建日志”中显示“Not only a Dockerfile in your OBS path, please make sure, The dockerfile