检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
(2)将代码示例中的请求url替换为自定义OCR部署后生成的url,只使用图片中用蓝色标注的字段进行替换。 (3)将代码示例中的# option["side"]="front"替换为: option["template_id"]="xxx" template_id的值可以在自定义OCR部署发布后获取。
检查不同标签的样本数是否均衡,建议不同标签的样本数量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前
会影响模型整体的识别效果。 如果分割效果不好,建议检测图片标注,标注质量的好坏直接影响模型训练图像分割效果的好坏。 根据数据量选择适当的学习率和训练轮次。 通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前
“删除”:单击“删除”,弹出“确认删除”对话框,单击“确认”,删除当前模板。 在“应用资产>自定义字段类型”页面下,可以查看自己定义的字段类型,也可单击“创建字段类型”,在此处创建新的字段类型,详情请见2.4.8-自定义字段类型(通用单模板分类工作流)、自定义字段类型(多模板分类工作流)。 查看应用开发配置 在“应
身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例 自定义字典 取值范围 在识别当前字段类型的文字时,选择字典的取值范围中最相似的取值为最后识别结果。
身份证照片,可新增字段类型“出生日期”。 “字段属性”:选择字段属性,可选择“自定义正则提取”和“自定义字典”,然后按表1填写相关信息。 表1 字段属性参数说明 字段属性 参数 参数说明 举例 自定义字典 取值范围 在识别当前字段类型的文字时,选择字典的取值范围中最相似的取值为最后识别结果。
通用单模板工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 评估应用 部署服务 自定义字段类型 编辑应用 删除应用 父主题: 文字识别套件
多模板分类工作流 工作流介绍 上传模板图片 定义预处理 框选参照字段 框选识别区 训练分类器 评估应用 部署服务 编辑应用 自定义字段类型 删除应用 父主题: 文字识别套件
优势 解决手工录入投入大、效率低、语种多等问题,提升业务效率。 一键式部署,快速输出高精度结构化数据。 多模板分类工作流 功能介绍 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 适用场景 用户认证识别 识别证件
只有调用成功才会计算调用次数,其中2xx状态码表示调用成功。 计费模式 按需计费 指按照自定义模板文字识别API调用次数、阶梯价格计费,按月累计,一个自然月后次数清零重新累计。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 套餐包 用户可以购买套餐包,扣费时,优先在套餐包内进行
只有调用成功才会计算调用次数,其中2xx状态码表示调用成功。 计费模式 按需计费 指按照自定义模板文字识别API调用次数、阶梯价格计费,按月累计,一个自然月后次数清零重新累计。具体计费价格请参见文字识别价格详情,类型选择“自定义模板OCR”。 套餐包 用户可以购买套餐包,扣费时,优先在套餐包内进行
当前服务提供预置预训练模型“BERT”、“TinyBERT”、“FastText”。本样例使用“FastText”模型。 在参数配置,填写“学习率”和“训练轮次”。 本样例使用“学习率”为“0.00001”,“训练轮次”为“3”。 单击右下角的“开始训练”,开始训练模型。 模型训练一般需要运行一段时间
针对刚创建的数据集(未发布前),无数据集版本信息,必须执行发布操作后,才能应用于模型开发或训练。 数据集版本,默认按V001、V002递增规则进行命名,您也可以在发布时自定义设置。 您可以将任意一个版本设置为当前目录,即表示数据集列表中进入的数据集详情,为此版本的数据及标注信息。 针对每一个数据集版本,您可以通
通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。 多模板工作流 通过工作流指引支持自定义多个文字识别模板,通过模型训练,自动识别图片所属模板,从而支持从大量不同板式图像中提取结构化信息。通常适用于物流行业,实现多样化快递单场景
通用单模板工作流 通过构建文字识别模板,识别单个板式图片中的文字,提供高精度的文字识别模型,保证结构化信息提取精度。 多模板分类工作流 支持用户自定义多个文字识别模板,通过模型训练,自动识别图片所需使用的模板,从而支持从大量不同板式图像中提取结构化信息。 详细介绍请见产品介绍>文字识别套件。