检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
的文字信息结构化提取。 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 支持开发属于自己的文字识别应用,服务自动生成“API URI”,您可以调用当前模板服务。调用方式请见API调用指南。错误码请参见错误码。
EG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有材质类型的待定级图片。 为保证训练效果,需要准备至少20张待训练的图片数据,低于20张工作流数据处理会报错。此外,为优化模型,建议对金相图像的第二相边界标注清晰。
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
EG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的热轧钢板表面缺陷标签准备图片数据。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型。 父主题: 热轧钢板表面缺陷检测工作流
板图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从
文字识别套件使用简介 ModelArts Pro 是为企业级AI应用打造的专业开发套件。基于华为云的先进算法和快速训练能力,提供预置工作流和模型,提升企业AI应用的开发效率,降低开发难度。文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识
准备数据 在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计实体标签 首先需要确定好文本实体的标签,即希望抽取出文本的一种结果。例如“时间”、“地点”、“人物”等。 数据集要求 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。
纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型。 父主题: 刹车盘识别工作流
标注数据 由于模型训练过程需要大量有标签的数据,如果开发应用时,上传的训练数据集是未标注的,需要对数据集中的数据进行标注。 针对文本分类场景,是对文本的内容按照标签进行分类处理,标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 进入数据标注页面 在“
、JPEG、PNG、BMP。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖所有标签的图片。 基于已设计好的商品标签准备图片数据。每个商品标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个商品标签准备200个以上的数据。
模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。 本章节提供一个票证类型的样例,帮助您快速熟悉使用文字识别套件中的多模板工作流开发应用的过程。通过上传模板图片、框选参照字段和识别区、上传训练集,自动训练并生成模板分类器和文字识别模型,并将生成
使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“
使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。 定义预处理 在“
选择数据 在使用第二相面积含量测定工作流开发应用时,您需要选择训练数据集,后续训练模型操作是基于您选择的训练数据集。 训练数据集可以选择创建一个新的数据集,也可以选择导入基于第二相面积含量测定工作流创建的其他应用中已创建的数据集。 新建训练数据集 导入数据集 前提条件 已在视觉套
HiLens安全帽检测技能 可训练技能模板介绍 准备数据 选择数据 训练模型 评估模型 部署服务 父主题: HiLens套件
纵轴为标签对应的有效“样本数”。 图5 标签解析 后续操作 选择训练数据集后,单击右下角的“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型。 父主题: 云状识别工作流
不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据尽量多,尽量均衡。每个分类标签需要准备20个数据以上,为了训练出效果较好的模型,建议每个分类标签准备200个以上的数据。
标签解析 后续操作 在“数据选择”页面选择训练数据集,并针对未标注的数据进行数据标注,然后单击“下一步”,进入应用开发的“模型训练”步骤,详细操作指引请参见训练模型。 父主题: 通用文本分类工作流