检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
手动续费 套餐包文字识别服务从购买到到期之前,您可以随时在OCR控制台为文字识别服务续费,以延长文字识别服务的使用时间。 在费用中心续费 登录管理控制台。 单击“控制台”页面右上方“费用”,在下拉菜单中选择“续费管理”。 进入“续费管理”页面。 图1 续费管理 自定义查询条件。
VmOperateResult objects 操作失败桌面列表。 job_id String 任务ID,冷迁移启动时返回。 表5 VmOperateResult 参数 参数类型 描述 desktop_id String 桌面ID。 desktop_name String 桌面名称。 error_code String
服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录OCR的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 CTS支持追踪的OCR管理事件列表,请参见审计。
业务函数代码并设置运行的条件,无需配置和管理服务器等基础设施,函数以弹性、免运维、高可靠的方式运行。此外,按函数实际执行资源计费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。
权限管理 权限管理 创建用户组与IAM用户 为IAM用户分配权限 IAM用户登录并验证权限 OCR自定义策略
方案OBS桶名称为前缀的委托,单击“删除”。 图1 删除委托 在弹出的删除确认框中单击“是”进行删除。 图2 确认删除 一键卸载 登录发票识别与验真解决方案部署页面。 单击方案堆栈后的“删除”。 图3 一键卸载 在弹出的删除堆栈确认框中,输入方案的堆栈名称,单击“确认”,即可卸载解决方案。
给子账户授予权限请参考权限管理。 图4 设置用户组 开通服务: 单击“控制台”>“服务列表”>“人工智能”>“文字识别OCR”,进入文字识别控制台。 图5 文字识别控制台 在文字识别控制台“总览”页面,选择对应产品的“终端节点”。不同区域OCR产品部署情况请参考终端节点。 图6 终端节点
申请服务操作步骤参见文档为《文字识别API参考》。 2018-07-30 修改 删除银行卡识别、一维码识别、二维码识别和车牌识别相关内容。 2018-05-10 新增 银行卡识别服务的demo用例 一维码识别服务的demo用例 二维码识别服务的demo用例 车牌识别服务的demo用例 机动车销售发票识别的demo用例
能处理反光、暗光等干扰的图片但影响识别精度。 目前支持识别单张身份证的正面或者反面。 支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。 户口本识别 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
关闭服务 OCR服务开通后,如不使用,可登录控制台进行关闭。 如果您是主账户,也可以控制子用户的服务开通、关闭状态。 图1 关闭服务 图2 控制子用户的开通、关闭
当您完成了调用API、调用SDK基本操作后,可以根据自身的业务需求使用OCR提供的入门实践。 表1 常用最佳实践 实践 描述 发票识别与验真 该实践基于华为云文字识别服务增值税发票识别与发票验真技术构建,自动识别和录入增值税发票各字段信息,减少人工核算工作量,实现财税报销自动化。同时,自动接入国家税务机关发票查
主体识别示例 本章节对主体识别AK/SK方式使用SDK进行示例说明。 主体识别示例代码只需将AK/SK信息替换为实际AK/SK,代码中可以使用初始化ImageMainObjectDetectionReq中的url或image配置图像信息(image和url参数二选一),示例中以url为例,配置完成后运行即可。
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“通用单模
规格 防疫健康码识别 防疫健康码识别套餐包1000万次 防疫健康码识别套餐包500万次 防疫健康码识别套餐包100万次 防疫健康码识别套餐包50万次 防疫健康码识别套餐包10万次 防疫健康码识别套餐包1万次 防疫健康码识别套餐包1千次 核酸检测记录识别 核酸检测记录识别套餐包1000万次
框选识别区 在文字识别过程中,需要确定图片中识别的文字位置,这就需要在图片模板中框选识别区。 识别区指图片中待识别的文字位置。所有需要识别的图片中都会包含此识别区的字段,且位置固定不变,因此模型可以通过识别区找到需要识别内容的位置。 前提条件 已在自定义OCR控制台选择“多模板分
OCR服务能否实时处理视频流中的文字 通用表格识别是否支持导出为excel格式 使用OCR服务是否必须使用华为云存储图片 OCR服务可以识别文本格式文件吗 接口返回时间较长,如何提高响应速度 OCR服务是否支持二维码识别 OCR服务是否支持离线使用 OCR服务一次可以识别多张身份证吗 身份证识别可以判断身份证真假么
识别身份证正反面总计调用几次接口 使用身份证识别时,如果要识别身份证的正面和反面,需要您调用两次身份证识别接口,具体请参见身份证识别章节。 父主题: API使用类
在客户使用OCR能力,进行二次开发时,可以尽可能的通过页面可视化提醒等方式,引导使用者尽量拍摄符合人眼易于识别的图片,以保障数据质量、同时提升识别准确率。 由于图片的输入非常开放,因此为了避免恶意攻击,在公有云上对有效识别的信息(即便部分不准)也会计费,类似于在通话质量不佳时通常也是要求计费。 父主题:
String 文字块识别结果。 location Array<Array<Integer>> 文字块的区域位置信息,列表形式,包含文字区域四个顶点的二维坐标(x,y);坐标原点为图片左上角,x轴沿水平方向,y轴沿竖直方向。 confidence Float 文字块识别结果的置信度。