检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用于训练多模板分类器的训练集,需要把各个模板的训练图片打包成一个文件夹并压缩成“zip”包,“zip”包文件大小不超过10M。 例如训练“保险单”模板的训练集,需要把同模板的保险单图片打包成一个文件夹并压缩成“zip”包。 步骤2:新建应用 登录ModelArts Pro控制台,单击“文字识别”套件卡片的“进入套件”。
如果识别结果正确,可对模板作进一步评估,详情请见评估模板。 评估模板 通过上传测试图片,在线评估模板识别并提取结构化文字的能力。 首先在“应用开发>评估”页面右侧选择与待评估模板对应的原模板,然后选择本地上传测试图片或者上传在线图片,评估模板。 图4 评估模板 本地上传图片 默认进入“本地上传”页签,单击“
识别证件中关键信息,节省人工录入,提升效率,降低用户实名认证成本,准确快速便捷。 快递单自动填写 识别图片中联系人信息并自动填写快递单,减少人工输入。 合同录入与审核 自动提取合同结构化信息,有助快速审核。 优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选
计,一个自然月后次数清零重新累计。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 套餐包 用户可以购买套餐包,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,转回按需计费方式。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 自然语言处理套件
计,一个自然月后次数清零重新累计。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 套餐包 用户可以购买套餐包,扣费时,优先在套餐包内进行抵扣。超出套餐包额度,转回按需计费方式。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 自然语言处理套件
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
ModelArts Pro 资源池 工作流 应用管理 文字识别套件 自然语言处理套件 视觉套件 HiLens套件 共享带宽 共享流量包 带宽加油包 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 VPC对等连接 OBS 2.0支持ModelArts
t”的文件夹用于存放输出的数据集。 创建OBS桶和文件夹的操作指导请参见创建桶和新建文件夹。为保证数据能正常访问,请务必保证创建的OBS桶与ModelArts Pro服务在同一区域。 参考上传文件,使用单个文件上传方式将本地准备的训练数据集“Training-Dataset”文件
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别
“取值范围”:“Shenzhen”、“Beijing”、“Xi'an” 在识别“字段类型”为“城市”的文字时,从“Shenzhen”、“Beijing”、“Xi'an”中找出与待识别文字最相似的取值,作为识别结果。 自定义正则提取 预过滤 对初始的待识别文字进行预处理。 左边输入框填写待识别文字中被替换字符的正则表达式。
中文文本内容的分类。 针对已标注数据,文本分类的标注对象和标签在一个文本文件内,标注对象与标签之间,采用Tab键分隔,多个标签之间采用英文逗号分隔。 例如,文本文件的内容如下所示。标注对象与标注内容之间采用Tab键分隔。 华为通过不断的技术创新,来应对来自全球政治环境的挑战