华为云用户手册

  • 修改标注 当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。 基于图片修改 在数据集详情页面,单击“已标注”页签,然后在图片列表中选中待修改的图片,单击该图片跳转到标注页面,在右侧“标注”信息区域中对图片信息进行修改。 修改标签:“标注”区域中,单击编辑按钮,在文本框中输入正确的标签名,然后单击按钮完成修改。标签颜色不支持修改。 删除标签:在“标注”区域中,单击删除按钮,即可删除此图片中的标签。 标签删除后,单击页面左上角的项目名称离开标注页面。该图片会重新回到“未标注”页签。 图4 编辑物体检测标签 基于标签修改 在数据集详情页面,单击“已标注”页签,在图片列表右侧,显示全部标签的信息。单击操作列的编辑按钮,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的图片,都将被标注为新的标签名称。 图5 物体检测的全部标签
  • 操作步骤 选择“标签列”。在“数据标注”页面中,预览数据并选择训练目标。在“标签列”下拉框中选择需要设置为标签列的名称。 标签列是预测模型的输出。此处训练目标是鸢尾花的品种(即“attr_5”),该列目标结果是“离散值”。训练目标选择完成后,单击“训练”。 图1 预测分析数据标注界面 选择“标签列数据类型”。在“数据标注”页面中,“标签列数据类型”下选择合适的数据类型。 若标签列为枚举型数据,数据类型应选择“离散值”,预测分析将训练分类模型。 若标签列为数值型连续数据,数据类型应选择“连续数值”,预测分析将训练回归模型。 分类问题(离散值)在模型训练完成后,评估结果会展现召回率(Recall)、精确率(Precision)、准确率(Accuracy)及F1值(F1 Score)。 连续值在模型训练完成后,评估结果会展现平均绝对误差(Mean Absolute Error),均方误差(Mean Squared Error),均方根误差(Root Mean Squared Error)。
  • 部署上线 部署上线操作即将模型部署为在线服务,并且提供在线的测试UI与监控能力。完成模型训练后,可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。 在“模型训练”页签中,待训练状态变为“运行成功”,单击版本管理区域中的“部署”,开始将模型部署上线为在线服务。 图1 部署操作 在弹出的“部署”对话框中,选择资源规格,同时设置自动停止功能,然后单击确定,启动部署。 “计算节点规格”:以控制台实际提供为准。 “计算节点个数”:默认为1,且不能修改。 “是否自动停止”:启用该参数并设置时间后,服务将在指定时间后自动停止。如果不启用此参数,在线服务将一直运行,同时一直收费,自动停止功能可以帮您避免产生不必要的费用。默认开启自动停止功能,且默认值为“1小时后”。 目前支持设置为“1小时后”、“2小时后”、“4小时后”、“6小时后”、“自定义”。如果选择“自定义”的模式,可在右侧输入框中输入1~24范围内的任意整数。 启动部署上线后,可以在“部署上线”界面查看模型部署上线的状态。 部署上线将耗费较多时间,请您耐心等待。当“部署上线”页签版本管理区域的状态由“部署中”变更为“运行中”,部署完成。 在自动学习界面中,仅支持将训练后的模型部署为在线服务,如果需要部署为“批量服务”或“边缘服务”,请参见自动学习生成的模型,存储在哪里?支持哪些其他操作?。
  • 服务测试 您可以在“部署上线”页面,选择对应的服务类型,例如自动学习图像分类项目默认将服务部署为在线服务,进入“在线服务”页面,单击目标服务“操作”列的“预测”,进行服务测试,测试方法和下方陈述操作步骤一致。具体操作请参见测试服务。 您也可以通过调用代码对服务进行测试,根据部署服务类型的不同,具体操作详情参见访问在线服务、访问边缘服务。 下面的测试,是您在自动学习图像分类项目页面将模型部署上线之后进行服务测试的操作步骤。 模型部署完成后,您可添加图片进行测试。在“自动学习”页面,选择目标项目,进入“部署上线”界面,选择状态为“运行中”的服务版本,在“服务测试”区域单击“上传”,选择本地图片进行测试。 图2 上传图片 单击“预测”进行测试,预测完成后,右侧“预测结果”区域输出标签名称“sunflowers”和检测的评分。如模型准确率不满足预期,可在“数据标注”页签中添加图片并进行标注,重新进行模型训练及部署上线。预测结果中的参数说明请参见表1。如果您对模型预测结果满意,可根据界面提示调用接口访问在线服务,操作指导请参见“访问在线服务”。 目前只支持jpg、jpeg、bmp、png格式的图片。 图3 预测结果 表1 预测结果中的参数说明 参数 说明 predict_label 表示图片预测的标签。 scores 表示Top5标签的预测置信度。 由于“运行中”的在线服务将持续耗费资源,如果不需再使用此在线服务,建议在版本管理区域,单击“停止”,即可停止在线服务的部署,避免产生不必要的费用。如果需要继续使用此服务,可单击“启动”恢复。 如果您启用了自动停止功能,服务将在指定时间后自动停止,不再产生费用。
  • 操作步骤 在开始训练之前,需要设置训练参数,然后再开始模型的自动训练。 在自动学习页面,单击创建成功的项目名称,进入“数据标注”页面,完成数据标注。 图1 完成数据标注 在“数据标注”页面,单击右上角“开始训练”,然后在弹出的“训练设置”对话框中,参考表1填写相关参数,然后单击“确定”,开始进行模型训练。 表1 训练设置参数说明 参数 说明 默认值 数据集版本名称 此版本即数据管理中发布数据集时设置的版本。自动学习项目中,启动训练作业时,会基于前面的数据标注,将数据集发布为一个版本。 系统将自动给出一个版本号,您也可以根据实际情况进行填写。 系统随机给出 最大训练时长(分钟) 设置最大训练时长,在该时长内若训练还未完成,则强制退出。为防止训练中退出,建议使用较大值。输入取值范围为6~6000。 60 计算规格 选择训练使用的资源规格。 以控制台实际提供为准。 训练参数设置完成后,单击“下一步”进入配置页,确认规格后单击“提交”进行模型的自动训练,训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。 在“模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。 训练完成后,您可以在界面中查看训练详情,如“准确率”、“评估结果”、“训练参数”、“分类统计表”等。 图2 训练详情 表2 评估结果参数说明 参数 说明 召回率 被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。 精确率 被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。 准确率 所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。 F1值 F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。 同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。
  • 修改标签 针对文本分类的自动学习项目,项目创建成功后,您可以根据业务变化,修改用于标注的标签。支持添加、修改和删除标签。 添加标签 在“已标注”页签下,单击“全部标签”右侧的加号,在弹出“新增标签”对话框中,设置“标签名称”和“标签颜色”,然后单击“确定”完成标签添加。 修改标签 在“已标注”页签中“全部标签”的下方,选择需要修改的标签,单击操作列的编辑图标,在弹出“修改标签”对话框中,修改“标签名称”或“标签颜色”,然后单击“确定”完成标签修改。 删除标签 在“已标注”页签中“全部标签”的下方,选择需要删除的标签,单击操作列的删除图标,在弹出“删除”对话框中,选择“仅删除标签”或“删除标签及仅包含此标签的标注对象”,然后单击“确定”完成标签删除。 所有的删除操作均不可恢复,请谨慎操作。 图4 修改标签
  • 添加或删除数据 自动学习项目中,数据来源为数据集中输入位置对应的OBS目录,当目录下的数据无法满足现有业务时,您可以在ModelArts自动学习页面中,添加或删除数据。 添加文件 在“未标注”页签下,可单击页面左上角的“添加文件”,您可以在弹出对话框中,选择本地文件上传。 上传文件格式需满足文本分类的数据集要求。 删除文本对象 在“已标注”页签或“未标注”页签下,选中需要删除的文本对象,单击页面左上角的“删除”,在弹出的对话框中,确认删除信息后,单击“确定”。 在“已标注”页签下,您还可以勾选“选择当前页”,单击“删除”,即可删除当前页下所有的文本对象及其标注信息。 图2 添加文件或删除文本对象
  • 自动学习流程介绍 使用ModelArts自动学习开发AI模型无需编写代码,您只需上传数据、创建项目、完成数据标注、发布训练、然后将训练的模型部署上线。具体流程请参见图1。新版自动学习中,该流程可完全由Workflow进行承载,如图2。开发者可以通过Workflow进行有向无环图(Directed Acyclic Graph,DAG)的开发,整个DAG的执行就是有序的任务执行模板,依次执行从数据标注、数据集版本发布、模型训练、模型注册到服务部署环节。若想了解更多关于Workflow您可以参考Workflow简介。 图1 自动学习操作流程 图2 Workflow运行流程
  • 操作步骤 在“自动学习”页面,单击创建成功的项目名称,进入“数据标注”页面,完成数据标注。 图1 完成数据标注 在“数据标注”页面,单击右上角的“开始训练”,然后在弹出的“训练设置”对话框中配置相关参数。参数说明请参见表1。 表1 训练设置参数说明 参数 说明 默认值 数据集版本名称 此版本即数据管理中发布数据集时设置的版本。自动学习项目中,启动训练作业时,会基于前面的数据标注,将数据集发布为一个版本。 系统将自动给出一个版本号,您也可以根据实际情况进行填写。 系统随机给出 训练验证比例 训练验证比例表示将已标注样本随机分为训练集和验证集的比例,默认训练集比例为0.8,即全部分为训练集,manifest中的usage字段记录划分类别。取值范围为0~1。 0.8 最大训练时长(分钟) 即最大训练时长,在该时长内若训练还未完成,则强制退出。为防止训练中退出,建议使用较大值。输入范围为6~6000。适当延长训练时间,500条文本的训练集建议选择运行120分钟以上。 60 训练偏好 performance_first:性能优先,训练时间较短,模型较小 balance:平衡 accuracy_first:精度优先,训练时间较长,模型较大 balance 计算规格 选择训练使用的资源规格。 以控制台实际为准。 训练参数设置完成后,单击“下一步”进入配置页,确认规格后单击“提交”进行模型的自动训练,训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。 在“模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。 训练完成后,您可以在界面中查看训练详情,如“准确率”、“评估结果”、“训练参数”、“分类统计表”等。评估结果参数说明请参见表2。 图2 训练详情 表2 评估结果参数说明 参数 说明 召回率 被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。 精确率 被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。 准确率 所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。 F1值 F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。 同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。
  • 操作步骤 在自动学习页面,单击创建成功的项目名称,进入“数据标注”页面,完成“标签列”和“标签列数据类型”的选择。 在“数据标注”页面下方,单击“训练”,在弹出的“训练设置”对话框中,选择训练使用的“计算规格”,单击“下一步”进入配置页,确认规格后单击“提交”开始模型训练。 预测分析类型的自动学习,只支持使用“自动学习专用实例CPU(8U)”训练模型。 训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。 图1 训练设置 在“模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。 图2 运行成功 训练完成后,您可以在界面中查看训练详情,如“标签列”和“标签列数据类型”、“准确率”、“评估结果”等。 该示例为二分类的离散型数值,评估效果参数说明请参见表1。 不同类型标签列数据产生的评估结果说明请参见评估结果说明。 同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。
  • 评估结果说明 根据训练数据类的不同评估结果会包含不同的指标。 离散值评估结果 包含评估指标为召回率(Recall)、精确率(Precision)、准确率(Accuracy)与F1值(F1 Score)。下表为具体说明: 表1 离散值评估结果包含指标说明 参数 说明 召回率 被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。 精确率 被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。 准确率 所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。 F1值 F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。 连续数值评估结果 包含评估指标为平均绝对误差(Mean Absolute Error)、均方误差(Mean Squared Error)与均方根误差(Root Mean Squared Error)。三个误差值能够表征真实值和预测值之间的差距。在多次建模的过程中,每一次建模结果都会产生一组误差值,评判一个模型好坏的方法就是看这三个误差值是否变小或者变大,误差值越小表示模型越好。
  • 预测分析文件内容示例 以鸢尾花数据集为例:根据鸢尾花的花萼与花瓣长宽,预测鸢尾花的品种。 表1 数据源的具体字段及意义 字段名 含义 类型 描述 attr_1 萼长 Double 花萼的长度 attr_2 萼宽 Double 花萼的宽度 attr_3 瓣长 Double 花瓣的长度 attr_4 瓣宽 Double 花瓣的宽度 attr_5 品种 String 鸢尾花的品种 表2 样本数据 attr_1 attr_2 attr_3 attr_4 attr_5 5.1 3.5 1.4 0.2 Iris-setosa 7 3.2 4.7 1.4 Iris-versicolor 6.3 3.3 6 2.5 Iris-virginica
  • 数据上传至OBS 在本文档中,采用管理控制台上传数据至OBS。 执行如下操作,将数据导入到您的数据集中,以便用于模型训练和构建。 登录OBS管理控制台,在ModelArts同一区域内创建桶。如果已存在可用的桶,需确保OBS桶与ModelArts在同一区域。 参考上传文件,将本地数据上传至OBS桶中。如果您的数据较多,推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。 在上传数据时,请选择非加密桶进行上传,否则会由于加密桶无法解密导致后期的训练失败。
  • 数据集要求 文件规范:名称由以字母数字及中划线下划线组成,以'.csv'结尾,且文件不能直接放在OBS桶的根目录下,应该存放在OBS桶的文件夹内。如:“/obs-xxx/data/input.csv”。 文件内容:文件保存为“csv”文件格式,文件内容以换行符(即字符“\n”,或称为LF)分隔各行,行内容以英文逗号(即字符“,”)分隔各列。文件内容不能包含中文字符,列内容不应包含英文逗号、换行符等特殊字符,不支持引号语法,建议尽量以字母及数字字符组成。 训练数据: 训练数据列数一致,总数据量不少于100条不同数据(有一个特征取值不同,即视为不同数据)。 训练数据列内容不能有时间戳格式(如:yy-mm-dd、yyyy-mm-dd等)的数据。 如果某一列的取值只有一种,会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。 标签列指的是在训练任务中被指定为训练目标的列,即最终通过该数据集训练得到模型时的输出(预测项)。 除标签列外数据集中至少还应包含两个有效特征列(列的取值至少有两个且数据缺失比例低于10%)。 训练数据的csv文件不能包含表头,否则会导致训练失败。 当前由于特征筛选算法限制,标签列建议放在数据集最后一列,否则可能导致训练失败。
  • 修改标注 当数据完成标注后,您还可以进入“已标注”页签,对已标注的数据进行修改。 基于音频修改 在数据集详情页,单击“已标注”页签,然后在音频列表中选中待修改的音频(选择一个或多个)。在右侧标签信息区域中对标签进行修改。 修改标签:在“选中文件标签”区域中,单击操作列的编辑图标,然后在文本框中输入正确的标签名,然后单击确定图标完成修改。 删除标签:在“选中文件标签”区域中,单击操作列的删除图标,在弹出的对话框中单击“确定”删除该标签。 基于标签修改 在数据标注页面,单击“标签管理”页签,在标签管理页,显示全部标签的信息。 图3 全部标签的信息
  • 同步或添加音频 在“自动学习”页面,单击项目名称,进入自动学习“数据标注”页面。声音分类项目创建时,音频来源有两种,通过本地添加或同步OBS中的数据。 添加音频:您可以将本地音频快速添加到ModelArts,同时自动上传至创建项目时所选择的OBS路径中。单击“添加音频”,在弹出的对话框中单击“添加音频”并添加。 仅支持16bit WAV格式音频文件,单个音频文件不能超过4MB,且单次上传的音频文件总大小不能超过8MB。 数据源同步:为了快速获取用户OBS桶中最新音频,单击“数据源同步”,快速将通过OBS上传的音频数据添加到ModelArts。 删除音频:您可以依次单击选中音频,或勾选“选择当前页”选中该页面所有音频进行删除操作。 所有的删除操作均不可恢复,请谨慎操作。
  • 音频标注 选择未标注音频。在“数据标注”页面单击“未标注”页签,此页面展示所有未标注的音频数据。依次单击选中待标注的音频,或勾选“选择当前页”选中该页面所有音频,在页面右侧进行标注。 图1 音频标注 添加标注。先对音频进行播放识别,然后选中音频文件,在右侧“标签”区域,输入“标签名”或从下拉列表中选择已添加的标签,同时可在下拉菜单中选择标签“快捷键”。单击“确定”,完成选中音频的标注操作。 图2 声音分类音频标注 当目录中所有音频都完成标注后,您可以在“已标注”页签下查看已完成标注的音频,或者通过右侧的“全部标签”列表,了解当前已完成的标签名称和标签数量。
  • 操作步骤 在“自动学习”页面,单击创建成功的项目名称,进入“数据标注”页面,完成数据标注。 图1 完成数据标注 在“数据标注”页面,单击右上角的“开始训练”,然后在弹出的“训练设置”对话框中配置相关参数。参数说明请参见表1。请确保训练验证比例输入值的小数位数应在1~5之间。 表1 训练设置参数说明 参数 说明 默认值 数据集版本名称 此版本即数据管理中发布数据集时设置的版本。自动学习项目中,启动训练作业时,会基于前面的数据标注,将数据集发布为一个版本。 系统将自动给出一个版本号,您也可以根据实际情况进行填写。 系统随机给出 训练验证比例 训练验证比例表示将已标注样本随机分为训练集和验证集的比例,默认训练集比例为0.8,即训练集占0.8,验证集占0.2。manifest中的usage字段记录划分类别。取值范围为0~1。 0.8 增量训练版本 用户可以在之前训练成功的版本中,自主选择精度最高的版本进行再训练,可以加快模型收敛速度,提高训练精度。 无 最大训练时长(分钟) 即最大训练时长,在该时长内若训练还未完成,则保存模型停止训练。为防止模型未收敛就退出,建议使用较大值。输入值取值范围为6~6000。建议适当延长训练时间,2000张图片的训练集建议选择运行1小时以上。 60 训练偏好 performance_first:性能优先,训练时间较短,模型较小 balance:平衡 accuracy_first:精度优先,训练时间较长,模型较大 balance 计算规格 选择训练使用的资源规格。 以控制台提供为准。 训练参数设置完成后,单击“下一步”进入配置页,确认规格后单击“提交”进行模型的自动训练,训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。 如果使用免费规格,还需仔细阅读界面提示,同时勾选“我已阅读并同意以上内容”。 在“模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。 图2 运行成功 训练完成后,您可以在界面中查看训练详情,如“准确率”、“评估结果”、“训练参数”、“分类统计表”等。评估结果参数说明请参见表2。 图3 模型训练结果 表2 评估结果参数说明 参数 说明 召回率 被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。 精确率 被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。 准确率 所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。 F1值 F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。 同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。
  • 升级到新版 登录ModelArts管理控制台,在左侧菜单栏中选择“自动学习”,进入“自动学习”项目列表页面。 查找您的旧版项目。在“自动学习”列表中,如果项目是旧版的,在项目名称处带有标识,针对此类项目,单击操作列的“升级”。 如果您的项目是新版的,则操作列中不存在“升级”按钮。 图1 查找旧版项目 在弹出的对话框中,设置需保存的“数据集名称”,以及数据集“存储路径”,然后单击“确定”启动升级。 图2 升级项目 等待项目升级,大概几分钟之后,项目将被升级为新版,项目名称处不再有旧版标识,且操作列不再存在“升级”按钮。
  • 服务测试 您可以在“部署上线”页面,选择对应的服务类型,例如自动学习物体检测项目默认将服务部署为在线服务,进入“在线服务”页面,单击目标服务“操作”列的“预测”,进行服务测试,测试方法和下方陈述操作步骤一致。具体操作请参见测试服务。 您也可以通过调用代码对服务进行测试,根据部署服务类型的不同,具体操作详情参见访问在线服务、访问边缘服务。 下面的测试,是您在自动学习物体检测项目页面将模型部署上线之后进行服务测试的操作步骤。 模型部署完成后,您可添加图片进行测试。在“自动学习”页面,选择目标项目,进入“部署上线”界面,选择状态为“运行中”的服务版本,在“服务测试”区域单击“上传”,选择本地图片进行测试。 图2 上传图片 单击“预测”进行测试,预测完成后,右侧“预测结果”区域输出结果。如模型准确率不满足预期,可在“数据标注”页签中添加图片并进行标注,重新进行模型训练及部署上线。预测结果中的参数说明请参见表1。如果您对模型预测结果满意,可根据界面提示调用接口访问在线服务,操作指导请参见“访问在线服务”。 目前只支持jpg、jpeg、bmp、png格式的图片。 图3 预测结果 表1 预测结果中的参数说明 参数 说明 detection_classes 每个检测框的标签。 detection_boxes 每个检测框的四点坐标(y_min,x_min,y_max,x_max),如图4所示。 detection_scores 每个检测框的置信度。 图4 检测框的四点坐标示意图 由于“运行中”的在线服务将持续耗费资源,如果不需再使用此在线服务,建议在版本管理区域,单击“停止”,即可停止在线服务的部署,避免产生不必要的费用。如果需要继续使用此服务,可单击“启动”恢复。 如果您启用了自动停止功能,服务将在指定时间后自动停止,不再产生费用。
  • 部署上线 部署上线操作即将模型部署为在线服务,并且提供在线的测试UI与监控能力。完成模型训练后,可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。 在“模型训练”页签中,待训练状态变为“运行成功”,单击版本管理区域中的“部署”,开始将模型部署上线为在线服务。 图1 部署操作 在弹出的“部署”对话框中,选择资源规格,同时设置自动停止功能,然后单击确定,启动部署。 “计算节点规格”:以控制台实际提供为准。 “计算节点个数”:默认为1,且不能修改。 “是否自动停止”:启用该参数并设置时间后,服务将在指定时间后自动停止。如果不启用此参数,在线服务将一直运行,同时一直收费,自动停止功能可以帮您避免产生不必要的费用。默认开启自动停止功能,且默认值为“1小时后”。 目前支持设置为“1小时后”、“2小时后”、“4小时后”、“6小时后”、“自定义”。如果选择“自定义”的模式,可在右侧输入框中输入1~24范围内的任意整数。 启动部署上线后,可以在“部署上线”界面查看模型部署上线的状态。 部署上线将耗费较多时间,请您耐心等待。当“部署上线”页签版本管理区域的状态由“部署中”变更为“运行中”,部署完成。 在自动学习界面中,仅支持将训练后的模型部署为在线服务,如果需要部署为“批量服务”或“边缘服务”,请参见自动学习生成的模型,存储在哪里?支持哪些其他操作?。
  • 服务测试 您可以在“部署上线”页面,选择对应的服务类型,例如自动学习预测分析项目默认将服务部署为在线服务,进入“在线服务”页面,单击目标服务“操作”列的“预测”,进行服务测试,测试方法和下方陈述操作步骤一致。具体操作请参见测试服务。 您也可以通过调用代码对服务进行测试,根据部署服务类型的不同,具体操作详情参见访问在线服务、访问边缘服务。 下面的测试,是您在自动学习预测分析项目页面将模型部署上线之后进行服务测试的操作步骤。 模型部署完成后,您可输入代码进行测试。在“自动学习”页面,选择目标项目,进入“部署上线”界面,选择状态为“运行中”的服务版本,在“服务测试”的“代码”区域,输入调试代码。 单击“预测”进行测试,预测完成后,右侧“返回结果”区域输出测试结果。如模型准确率不满足预期,可在“数据标注”页签,重新进行模型训练及部署上线。如果您对模型预测结果满意,可根据界面提示调用接口访问在线服务,操作指导请参见“访问在线服务”。 输入代码:attr_1~attr_4为输入的预测数据,其中在“数据标注”中,选择的标注列为attr_5,即attr_5为需要预测的目标列,输入数据中不再需要填写。 1 2 3 4 5 6 7 8 9 10 { "data": { "req_data": [{ "attr_1": 5.1, "attr_2": 3.5, "attr_3": 1.4, "attr_4": 0.2 }] } } 返回结果如图3所示:predict为目标列attr_5的预测结果。 图3 预测结果 由于“运行中”的在线服务将持续耗费资源,如果不需再使用此在线服务,建议在版本管理区域,单击“停止”,即可停止在线服务的部署,避免产生不必要的费用。如果需要继续使用此服务,可单击“启动”恢复。
  • 部署上线 部署上线操作即将模型部署为在线服务,并且提供在线的测试UI与监控能力。完成模型训练后,可选择准确率理想且训练状态为“运行成功”的版本部署上线。具体操作步骤如下。 在“模型训练”页签中,待训练状态变为“运行成功”,单击版本管理区域中的“部署”。 图1 部署操作 在弹出的“部署”对话框中,选择部署上线使用的“资源规格”,然后单击“确定”开始将模型部署上线为在线服务。 “计算节点规格”:选择计算资源,以控制台实际提供的规格为准。 “计算节点个数”:默认为1,且不能修改。 “是否自动停止”:启用该参数并设置时间后,服务将在指定时间后自动停止。如果不启用此参数,在线服务将一直运行,同时一直收费,自动停止功能可以帮您避免产生不必要的费用。默认开启自动停止功能,且默认值为“1小时后”。 目前支持设置为“1小时后”、“2小时后”、“4小时后”、“6小时后”、“自定义”。如果选择“自定义”的模式,可在右侧输入框中输入1~24范围内的任意整数。 图2 部署上线 启动部署上线后,可以在“部署上线”界面查看模型部署上线的状态。 部署上线将耗费较多时间,请您耐心等待。当“部署上线”页签版本管理区域的状态由“部署中”变更为“运行中”,部署完成。 在自动学习界面中,仅支持将训练后的模型部署为在线服务,如果需要部署为“批量服务”或“边缘服务”,请参见自动学习生成的模型,存储在哪里?支持哪些其他操作?。
  • 图片标注 在“数据标注”页面单击“未标注”页签,此页面展示所有未标注的图片数据。依次单击选中待标注的图片,或勾选“选择当前页”选中该页面所有图片,在页面右侧进行图片标注。 图1 图片标注 选中图片后,在页面右侧“添加标签”,输入“标签名”或从下拉列表中选择已添加的标签。单击“确定”,完成选中图片的标注操作。例如,您可以选择多张图片,按照花朵种类将图片标注为“tulips”。同样选择其他未标注分类图片,将其标注为“sunflowers”、“roses”等。标注完成后,图片将存储至“已标注”页签下。 图片标注支持多标签,即一张图片可添加多个标签。 标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 图2 图像分类图片标注 当图片目录中所有图片都完成标注后,您可以在“已标注”页签下查看已完成标注的图片,或者通过右侧的“全部标签”列表,了解当前已完成的标签名称和标签数量。
  • 修改标注 当数据完成标注后,您还可以进入已标注页签,对已标注的数据进行修改。 基于图片修改 在数据标注页面,单击“已标注”页签,然后在图片列表中选中待修改的图片(选择一个或多个)。在右侧标签信息区域中对图片信息进行修改。 添加标签:在“标签名”右侧文本框中,选择已有标签或输入新的标签名,然后单击“确定”,为选中图片增加标签。 修改标签:在“选中文件标签”区域中,单击操作列的编辑图标,然后在文本框中输入正确的标签名,然后单击图标完成修改。 图5 编辑标签 删除标签:在“选中文件标签”区域中,单击操作列的删除该标签。 基于标签修改 在数据标注页面,单击“已标注”页签,在图片列表右侧,显示全部标签的信息。 图6 全部标签的信息 修改标签:单击操作列的编辑按钮,然后在弹出的对话框中输入修改后的标签名,然后单击“确定”完成修改。修改后,之前添加了此标签的图片,都将被标注为新的标签名称。 删除标签:单击操作列的删除按钮,在弹出的对话框中,选择“仅删除标签”、“删除标签及仅包含此标签的图片(不删除源文件)”或“删除标签及仅包含此标签的图片(同时删除源文件)”,然后单击“确定”。 图7 删除标签
  • 处理方法 将pretrained改成false,提前下载好预训练模型,加载下载好的预训练模型位置即可,可参考如下代码。 import torch import torchvision.models as models model1 = models.resnet34(pretrained=False, progress=True) checkpoint = '/xxx/resnet34-333f7ec4.pth' state_dict = torch.load(checkpoint) model1.load_state_dict(state_dict) 必现的问题,使用本地Pycharm远程连接Notebook调试。
  • 标注信息不满足训练要求 针对不同类型的自动学习项目,训练作业对数据集的要求如下。 图像分类:用于训练的图片,至少有2种以上的分类(即2种以上的标签),每种分类的图片数不少于5张。 物体检测:用于训练的图片,至少有1种以上的分类(即1种以上的标签),每种分类的图片数不少于5张。 预测分析:由于预测分析任务的数据集不在数据管理中进行统一管理,即使数据不满足要求,不在此环节出现故障信息。 声音分类:用于训练的音频,至少有2种以上的分类(即2种以上的标签),每种分类的音频数不少于5个。 文本分类:用于训练的文本,至少有2种以上的分类(即2种以上的标签),每种分类的文本数不少于20个。
  • 处理方法 到SWR检查下对应的镜像是否存在,对应镜像的镜像地址是否和实际地址一致,大小写,拼写等是否一致。 检查用户给ModelArts的委托中是否有SWR的权限,可以在全局配置中查看对应用户的授权内容,查看授权详情。如果没有对应权限,需要到 统一身份认证 服务给对应委托中加上对应权限。 图1 全局配置 图2 查看权限详情和去 IAM 修改委托权限 图3 给委托添加授权 将镜像设置成私有镜像 登录 容器镜像服务 (SWR),左侧导航栏选择“我的镜像”,查看镜像详情,单击右上角“编辑”按钮,把镜像类型修改为“私有”。 图4 修改镜像类型为私有
  • 常见问题 模型文件目录下不能出现dockerfile文件; “查看构建日志”中显示“Not only a Dockerfile in your OBS path, please make sure, The dockerfile list”,表示dockerfile文件目录有问题,模型文件目录下不能出现dockerfile文件,需要去掉模型文件目录下存在dockerfile文件。 图2 构建日志:dockerfile文件目录有问题 pip软件包版本不匹配,需要修改为日志中打印的存在的版本。 图3 pip版本不匹配 构建日志中出现报错:“exec /usr/bin/sh: exec format error”。 这种报错一般是因为所用镜像系统引擎和构建镜像的系统引擎不一致引起的,例如使用的是x86的镜像却标记的是arm的系统架构。 可以通过查看AI应用详情看到配置的系统运行架构。基础镜像的系统架构详情可以参考推理基础镜像列表。
  • 问题定位和处理 创建AI应用失败有两种场景:创建AI应用时直接报错或者是调用API报错和创建AI应用任务下发成功,但最终AI应用创建失败。 创建AI应用时直接报错或者是调用API报错。一般都是输入参数不合法导致的。您可以根据提示信息进行排查修改即可。 创建AI应用任务下发成功,但最终AI应用创建失败。需要从以下几个方面进行排查: 在AI应用详情页面,查看“事件”页签中的事件信息。根据事件信息分析AI应用失败原因,进行处理。 如果AI应用状态为“构建失败”,可以在AI应用详情页面,查看“事件”页签中的“查看构建日志”。构建日志中有对应的构建镜像失败的详细原因,根据构建失败的原因进行排查处理。 图1 查看构建日志
共100000条