检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
评估应用 训练模板分类模型后,需要对模板分类器和模板图片进行评估和考察。您可以通过上传测试图片,在线评估模板分类情况和模板的文字识别情况,保证能在多个模板情况下正确分类测试图片的模板,并且能正确识别测试图片中的识别区文字。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”
这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并框选参照字段,详情请见框选参照字段。 操作步骤
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,并上传模板图片,详情请见上传模板图片。
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在文字识别套件控制台选择“多模板分类工作流”新建应用,并上传模板图片,详情请见上传模板图片。
创建桶方法 控制台 通过控制台创建桶 OBS Browser+ 通过OBS Browser+创建桶 obsutil 通过obsutil创建桶 SDK 使用SDK创建桶,具体参考各语言开发指南的创建桶章节 API 通过API创建桶 上传对象 桶创建成功后,您可以通过以下多种方式将文件
刹车盘识别工作流支持“在线部署”和“HiLens部署”。 使用HiLens部署开发应用前,需要提前在华为HiLens控制台注册Atlas 500设备,详细注册方式请前往华为云论坛参与讨论。 确认信息后,单击“确定”。 成功新建应用。 后续操作 根据所选的预置工作流开发应用。 零售商品识别工作流
使用预置工作流开发应用流程 视觉套件提供了预置工作流,您可以通过预置的工作流,自主上传训练数据,构建和升级高精度识别模型。 图1 使用预置工作流开发应用 表1 使用预置工作流开发应用流程 流程 说明 详细指导 选择视觉套件 根据您的实际使用需求选择视觉套件。您也可以通过查看工作流定位所需使用的套件。 在ModelArts
通用文本分类工作流 根据工作流指引,开发文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更新和调整模型精度,实现高精度的文本预测分类。 通用文本分类工作流 多语种文本分类工作流 根据工作流指引,开发非中文语种的文本分类服务,通过上传训练数据,训练生成文本预测分类模型,自主更
及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流 通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量
导入已有数据集 前提条件 通用图像分类工作流支持将服务一键部署至边缘设备,如果将服务部署至边缘设备,请提前在华为HiLens控制台注册HiLens Kit设备,详细注册方式请前往华为云论坛参与讨论。 已在“工业智能体控制台>工业AI开发>工业AI开发工作流”选择“通用图像分类工作流”新建应用,详情请见新建应用。
自动识别结构化信息与提取签名盖章区域,有助快速审核。 自然语言处理套件 通用文本分类场景。 智能问答 通过中文分词、短文本相似度、命名实体识别等自然语言处理相关技术,计算两个问题对的相似度,可解决问答、对话、语料挖掘、知识库构建等问题。 内容推荐 通过文本分类预测模型,精确匹配出语义相似的内容,快速构建内容推荐场景。
工作流流程 在“ModelArts Pro>文字识别套件”控制台选择“通用单模板分类工作流”新建应用,详细操作请见新建应用。您可以创建单模板服务,通过模板训练文字识别模型,实现单模板图像的文字信息结构化提取。 图1 创建单模板流程 表1 创建单模板流程说明 流程 说明 详细指导 上传模板图片
如果您选择的数据集均为已标注数据,可不用创建SKU,直接单击“下一步”,进入“数据标注”步骤,自动标注数据。 新建SKU 当一次性上传一个SKU,即一种类别的商品时,您可以通过新建SKU操作上传SKU图片。 在“SKU创建”页面,单击“新建SKU”。 弹出“新建SKU”对话框。 在“新建SKU”对话框中,按表1填写信息,然后单击“确定”。
测”,在申请公测页面根据界面提示填写所需信息。 申请公测操作完成后,单击“前往我的公测”,进入“我的公测”页面。当“审批状态”显示为“审批通过”时,表示您已经获得了该行业套件的公测权限。 申请行业套件的公测权限后,即可进入套件使用相关功能。 进入套件 登录ModelArts Pr
模型如何提升效果 检查图片标注是否准确,第二相区域标注工作量较大,建议基于自动标注的结果进一步优化标注精度。 可根据损失函数选择适当的训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 模型训练完成后,单击“下一步”,进入应用开发的“模型评估”步骤,详细操作指引请参见评估模型。