检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面
删除应用 如果已创建的模板应用不再使用,您可以删除模板释放资源。 操作步骤 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。 图1 进入应用资产 在“分类器列表”页签,选择多模板名称
创建企业项目 创建企业项目的用户必须是管理员,或在IAM侧已被授予EPS FullAccess权限的用户。 企业账号可申请开通企业项目。账号需要进行企业实名认证。如果企业账号注册成为华为云合作伙伴,将无法进入企业项目管理页面。 图1 操作流程 创建IAM用户并授权使用OCR 创建IAM
开通文字识别服务 OCR服务提供的开通方式有以下两种,用户可以任选其一进行开通服务。 按需计费开通服务 进入文字识别官网主页,单击“立即使用”,进入文字识别控制台。 在“总览”页面,选择需要使用的服务,执行开通操作,默认的计费方式采用按需计费。 图1 服务开通 服务开通成功后,开通状态将显示为
手动续费 套餐包文字识别服务从购买到到期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。 在费用中心续费 登录管理控制台。 单击“控制台”页面右上方“费用”,在下拉菜单中选择“续费管理”。 进入“续费管理”页面。 图1 续费管理 自定义查询条件。 可在
创建用户组与IAM用户 创建用户组 使用主账号登录IAM服务控制台。 左侧导航窗格中,选择“用户组”页签,单击右上方的“+创建用户组”。 在“创建用户组”界面,输入“用户组名称”,创建用户组。 返回用户组列表,单击列表中的“授权”。 勾选需要授予用户组的权限,单击“确定”,完成用户组授权
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的模板样式的图片。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并完成评估模板步骤,详情请见评估。 操作步骤 在“应用开发>评估”页面完成模板评估后,单击“下一步”,
模板总览 预览分类器下面所有模板的状态,如果有模板的识别区未设置,则无法进行后续的评估。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并框选添加的多个模板的识别区,详情请见框选识别区。 删除模板 如果已创建的模板应用不再使用,您可以删除模板释放资源。 在“应用开发
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成模板评估后
定义预处理 使用通用单模板工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪、降噪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“通用单模板工作流”创建应用,并上传模板图片,
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模板工作流
上传模板图片 在使用多模板分类工作流开发应用之前,必须要明确文字识别的模板类型,明确以哪几种板式图片作为模板训练文字识别模型,基于自己的业务需求制定针对性的文字识别模型。例如上传两种不同格式的发票图片作为模板,训练的文字识别模型就能识别并提取这两种格式发票上的关键字段。 前提条件
定义预处理 使用多模板分类工作流上传模板图片后,需要对模板图片进行预处理,通过旋转、裁剪等操作。图片预处理的目的是保留图片的关键内容,去掉冗余部分,保持图片内容清晰可见,保证模型识别的准确性。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并上传模板图片,详情请见上传模板图片
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分类工作流
云容器引擎-成长地图 | 华为云 文字识别 文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片、扫描件或PDF、OFD文档中的打印字符识别成可编辑的文本格式
开始使用 通过华为云控制台使用 登录华为云对象存储服务控制台,查看部署完成后,自动创建的OBS桶列表。 图1 对象存储服务控制台 选择用于上传和存储发票图片或者PDF文件的桶“ocr-invoice-image-bucket”,上传示例发票图片或者电子发票pdf文件。 图2 上传待识别发票
安全 责任共担 身份认证与访问控制 数据保护技术 审计 服务韧性 监控安全风险
权限类 使用OCR服务需要的权限 如何通过主账号创建IAM账号 无权在控制台服务监控查看数据
调用SDK实现通用表格识别 文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。 本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。 使用OCR SDK的详细步骤如下所示: 步骤1:开通服务 步骤
自动续费 自动续费可以减少手动续费的管理成本,避免因忘记手动续费而导致文字识别服务被自动删除。自动续费的规则如下所述: 文字识别服务自动续费周期根据您开通自动续费的途径不同,遵循不同的规则。 在文字识别服务到期前均可开通自动续费,到期前7日凌晨3:00首次尝试自动续费,如果扣款失败