检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
确标签和预测标签,您可以对比正确标签和预测标签,判断当前模型预测该样本是否预测正确。 例如搜索框内输入标签“1”,下方会显示正确标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。 图10 详细评估 单击右下角的“发布部署”。
检查是否存在训练数据过少的情况,建议每个标签的样本数不少于100个,如果低于这个量级建议扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。
准备数据 在使用无监督车牌检测工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计车牌标签 首先需要考虑好车牌的标签类型,即希望识别出图片中车牌的一种结果。例如“plate”。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量
eg、bmp、png。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片,且数据集中每个标签要有大于5个样本。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example
在使用第二相面积含量测定工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 数据标签 标注基于ModelArts的图像分割标注基础能力,由于第二相边界多为不规则形状,目前采用多边形标注第二相,标签为“second_phase”。 数据集要求 文件名规范,不能有中文,不能有+、空格、制表符。
以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的实体标签准备文本数据。每个实体标签需要准备20个及以上数据,为了训练出效果较好的模型,建议每个实体标签准备100个以上的数据。 本工作流只支持上传未标注数据,将待标注的内容放在一个文本文件内。 上传数据至OBS
为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的热轧钢板表面缺陷标签准备图片数据。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。
为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的商品标签准备图片数据。每个商品标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个商品标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。
扩充。 检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 如果分割效果不好,建议检测图片标注,标注质量的好坏直接影响模型训练图像分割效果的好坏。 根据数据量选择适当的学习率和训练轮次。
针对所选择的训练数据集,如果每个标签的样本数量太少,可以选择合并标签。 打开合并标签开关,在下方填入需要合并的标签样本数量“上限值”,以及合并标签后新的“标签名”。 图5 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。
“详细评估”左侧在搜索框中搜索标签,右侧显示正确标签所对应样本的正确标签和预测标签,您可以对比正确标签和预测标签,判断当前模型对该样本的预测是否正确。 例如搜索框内输入标签“1”,下方会显示正确标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。
然后单击“确定”。 添加标签集 当上传的数据集状态为“未标注数据集”,需要添加标签名称。 单击文本框下方的添加标签。 鼠标移至文本框,单击文本框右侧的删除标签。 新建训练数据集后,勾选当前应用开发所需的训练数据集。 标注数据 由于模型训练过程需要有标签的数据,针对已上传的数据集
“详细评估”左侧在搜索框中搜索标签,右侧显示正确标签所对应样本的正确标签和预测标签,您可以对比正确标签和预测标签,判断当前模型对该样本的预测是否正确。 例如搜索框内输入标签“1”,下方会显示正确标签为“1”的样本中,预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息,包括样本的正确标签和预测标签。
入位置”的子目录。“数据集输出位置”建议选择一个空目录。 添加标签集 添加标签名称,选择标签颜色。 在文本框中输入标签名称,在右侧单击选择标签颜色。 单击文本框下方的添加标签。 鼠标移至文本框,单击文本框右侧的删除标签。 新建数据集后,单击数据集操作列的“标注”,进入数据集概览页
针对所选择的训练数据集,如果每个标签的样本数量太少,可以选择合并标签。 打开合并标签开关,在下方填入需要合并的标签样本数量“上限值”,以及合并标签后新的“标签名”。 图3 合并标签 查看标签解析 新建并选择训练数据集后,针对已标注的数据,您可以在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。
针对未标注数据,将待标注的内容放在一个文本文件内。 针对已标注数据,文本分类的标注对象和标签在一个文本文件内,标注对象与标签之间,采用Tab键分隔,多个标签之间采用英文逗号分隔。 例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 It feels very good, and
估结果。 模型评估 图1 模型评估 训练模型的版本、标签数量、测试集数量。单击“下载评估结果”,可保存评估结果至本地。 评估参数对比 图2 评估参数对比 左侧是各个标签数据的精确率、召回率、F1值。勾选标签,右侧会显示对应标签数据经过预置模型和增量模型评估后的参数对比柱状图。 详细评估
新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型。 父主题: 热轧钢板表面缺陷检测工作流
您可以在上方单击选择“评估范围”,单击“添加对比版本”。 详细评估 “详细评估”下方显示各个标签下正确率,即对应标签下预测正确的样本数占该标签下样本总数比例,单击各标签,右侧可查看该标签识别错误的图片。 后续操作 针对当前版本的模型,经过模型评估后,如果根据业务需求,模型还需继续
由于模型训练过程需要有标签的数据,针对已上传的数据集,手动添加或修改标签。 单击数据集操作列的“标注”,进入数据集概览页单击右上角的“开始标注”,在“数据标注”页面手动标注数据。 查看标签解析 新建并选择训练数据集后,针对已标注的数据,在“标签解析”中查看标签样本的统计数据,横轴为“标签”,纵轴为标签对应的有效“样本数”。