检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example
不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据集样本数应大于100,用于测试的已标注数据应不少于20张,样本数达1万张以上性能更优。 为了准确率,建议数据集中标注数据占总数
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
基于已设计好的热轧钢板表面缺陷标签准备图片数据。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。 针对未标注数据,要求将图片放在一个目录里,示例如下所示。 ├─dataset-import-example │ IMG_20180919_114732
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
调用文字识别套件API,报错ModelArts.4204服务未开通怎么办? 问题现象 子账号在使用自定义OCR(ModelArts Pro文字识别套件)生成的api时,出现如下报错。表示用户,没有OCR权限或没有开通ModelArts Pro服务。 "ModelArts.4204"、"Request
部署服务 评估模板应用后,就可以部署模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在“应用开发>部署”页面完
部署服务 评估模板应用后,就可以部署多模板应用至文字识别开发套件中,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并完成评估模板步骤,详情请见评估应用。 操作步骤 在
训练模型 针对已标注完成的训练数据,开始训练模型,您可以查看训练的模型准确率和误差变化。 前提条件 已在视觉套件控制台选择“热轧钢板表面缺陷检测工作流”新建应用,并已执行完“数据选择”步骤,详情请见选择数据。 训练模型 在“模型训练”页面,单击“开始训练”。 模型训练一般需要运行
框选参照字段 在文字识别过程中,套件会检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了检查并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断是否属于同一种模板,通过参照字段的位置来校正待识别图片。
意义。ModelArts Pro提供无监督车牌检测工作流,基于高精度的无监督车牌检测算法,无需用户标注数据,大大降低标注成本和提高车牌检测场景上线效率。 功能介绍 无需标注数据,构建无监督车牌检测模型,用于识别不同场景下的车牌。 适用场景 停车管理、交警执法、车辆保险等交通管理场景。
标注数据 针对已经选择的数据,在应用开发的“数据标注”页面,ModelArts Pro会自动标注数据,自动标注完成后,可对每个数据的标注结果进行核对和确认。 前提条件 已在视觉套件控制台选择“第二相面积含量测定工作流”新建应用,详情请见标注数据。 自动标注数据 在“数据标注”页面
”、“更新时间”和可执行的“操作”。 图3 历史版本 查看应用资产 在“应用详情”页的“应用资产”页签下,可以查看当前应用的资产信息,比如通用文本分类工作流中的资产信息就是训练数据集,您可以查看“数据集名称”、“描述”、“数据量”、“标注进度”、“标签总数”、“创建时间”和“操作
“编码”选择“UTF-8”格式。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 基于已设计好的分类标签准备文本数据。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 针对未标注数据,将待标注的内容放在一个文本文件内
注”,在“数据标注”页面手动标注数据。 自动标注数据 单击“下一步”,标注数据。 导入数据集 在“数据选择”页面,单击“导入数据集”。 弹出“导入数据集”对话框。 “导入数据集”对话框会显示您在第二相面积含量测定工作流创建的数据集信息以及在ModelArts中导入的数据集,包括“数据集名称”和“标注进度”。
息就是训练数据集,您可以查看“数据集名称”、“描述”、“数据量”、“标注进度”、“标签总数”、“创建时间”和“操作”,其中“操作”列可执行“管理”和“删除”操作。 “管理”:进入数据集管理页面,单击“开始标注”,可手动标注数据。 “删除”:单击“删除”,弹出“删除数据集”对话框,单击“确认”,即可删除当前数据集。
“编码”选择“UTF-8”格式。 以换行符作为分隔符,每行数据代表一个样本数据,单个样本不能有分行显示,不支持换行。 文本数据至少包含2个及以上的标签。每个分类标签需要准备5个及以上数据,为了训练出效果较好的模型,建议每个分类标签准备100个以上的数据。 多语种文本分类工作流仅支持对单语种的文本
训练模型 针对已标注完成的训练数据,开始训练模型,您可以查看训练的模型准确率和误差变化。 前提条件 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,并已执行完“数据选择”步骤,详情请见选择数据。 训练模型 在“模型训练”页面,单击“开始训练”。