检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
证鉴权的方式。 构造请求:Postman环境的构造请求请参考构造请求章节,SDK环境的API调用详见SDK参考。 除上述两种方式外,还可通过APIE在线调试的方式调用API,步骤如下。 开通服务后进入APIE界面。 选择已开通的服务和开通服务对应的Region。 Body部分填入
如何调用API 总览 开通服务 构造请求 认证鉴权 返回结果
如何查看审计日志 操作场景 在您开启了云审计服务后,系统开始记录云服务器的相关操作。云审计服务管理控制台保存最近7天的操作记录。 本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。 操作步骤 登录云审计服务控制台。 单击左侧导航树的“事件列表”,进入事件列表信息页面。 事
API是否可以混用 不建议混用,例如有专门的身份证识别,就不建议使用“通用文字识别”识别身份证图片,不同接口底层算法不同,混用会导致识别效果差。 父主题: API使用类
图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
本地调用 本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。 该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成
对证件、票据、表单等多版式文档进行文字识别、版面分析、键值对提取以及表格识别等任务,并以json格式返回识别的结构化结果。 约束与限制 支持中英文及部分中文繁体字。 只支持识别PNG、JPG、JPEG、BMP、GIF、TIFF、WEBP、PCX、ICO、PSD格式的图片以及PDF文档,PDF只支持单页识别,可通
业证上的文字信息。 自定义模板支持识别单模板应用或是多模板应用,单模板仅支持一种版式,多模板支持识别多种版式。 单模板的前提: 识别图片需与模板图片版式相同,具体而言,图片中要存在文字内容和位置均固定不变的文字(参照字段)。 识别文字内容不能偏离设定的识别区域,包括打印偏移、由上下文长度变化引起的偏移等。
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
回识别的文字和坐标。 驾驶证识别 识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 护照识别 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 银行卡识别 识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。 营业执照识别 识别营业
如何关闭已申请的服务 主账号可在“开通管理”里控制子用户服务的开通、关闭。 服务开通后,如不再使用,可登录主账号在控制台单击“开通管理”进行关闭。 图1 服务关闭 父主题: 服务开通类
受技术与成本多种因素制约,文字识别服务存在一些约束限制。 以通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制。 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。 图像各边的像素大小在15px到8192px之间。 图像中识别区域有效占比超过8
在使用多模板工作流开发应用之前,需要上传模板图片,明确以哪些图片作为模板训练文字识别模型。 上传模板图片 定义预处理 上传模板图片后,需要对模板图片进行预处理,去掉冗余部分,将图片旋转至水平,保证模型识别的准确性。 定义预处理 框选参照字段 在图片模板中框选参照字段,用于矫正图片的方向,进而在正确的方向上,识别图片中
套餐用完如何计费,如何查看剩余量及预警 套餐包配额使用完后,转为按需计费(按API调用成功的次数计费)。不使用则不计费。具体计费价格请参见文字识别价格详情。 查看套餐余量 登录文字识别控制台。 在“套餐包管理”中查看套餐余量。 图1 套餐包管理 设置套餐包剩余使用量预警 单击文字
可自动获取该发票的识别与验真结果,以发票文件名称为前缀的JSON文件存储。 图3 获取识别结果文件 通过华为云SDK使用 企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上传发票图片或者电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系
自动识别图片中的车牌信息。 名片识别 自动识别名片中的信息,识别信息包括姓名、职位头衔、公司、部门、联系方式、地址、邮箱、传真、邮编、公司网址等信息,并将识别结果返回给用户。 VIN码识别 自动识别图片上的车架号信息。 泰文身份证识别 自动识别身份证上的全部信息,一次扫描即可识别身份证号码、姓名、地址等全部信息。
response) 使用PDF进行文字识别 本示例将PDF文件转换为图片,并调用网络图片识别API,获取识别结果。 前提条件 开通网络图片识别。 参考本地调用,安装OCR Python SDK。并执行pip install fitz命令和pip install PyMuPDF==1
如何选择OCR套餐包的区域 不同的地域之间资源包不互通,每个地域需分别购买,请根据您的实际需求慎重选择。各服务所部署区域请参见终端节点。 请先确定使用的服务与区域之后再购买相应区域的套餐包。 父主题: 服务开通类
功能体验与试用 文字识别(Optical Character Recognition,OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式。OCR通过API提供服务能力,用户需要通过编程来处理识别结果。 在开通OCR前,请先使用OCR体验馆体验服务功