检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
训练分类器 确定模板图片的参照字段和识别区后,多模板分类工作流在模板数量较多,或版式相似度较高的情况下,建议针对不同的模板上传对应的训练集数据,用于训练模板分类模型,使服务能够精准地分类多个模板图片,然后对多个模板图片进行文字识别和结构化提取。 前提条件 已在文字识别套件控制台选择“
支持图像中身份证任意角度的水平旋转。 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。 能处理反光、暗光等干扰的图片但影响识别精度。 目前支持识别单张身份证的正面或者反面。 支持居民身份证的正反面同时识别,不支持存在两张及以上同面身份证的图片识别。 支持中国大陆护照的全字段识别。
如何查看API的使用量 登录文字识别管理控制台。 在左侧导航栏中选择“服务监控”,查看API的使用量。 图1 服务监控 父主题: API使用类
string 上传难例集的url。 获取难例集的url首先需要在难例上传界面配置相应的数据集,然后通过get_hard_sample_config获取难例配置,详情请见获取难例配置,返回值中的参数dataset_path对应的是数据集的url。 index 是 int 上传图片的序号。 model_name
图像各边的像素大小在15px到8192px之间。 支持同时返回单张图像中存在的多张回单识别结果。 图像中key值对应的value值为空时,不会返回对应的键值对。 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。 文字识别服务属于公有云服务,线上用户资源共享,如果需要多并发请求,请提前联系我们。
水印位置九宫格 如果为原图同时添加文字和图片水印时,水平距离x、垂直距离y和中线垂直偏移voffset可以用于调节水印位于原图中的位置,也可以调节两张水印的布局。 图片水印 添加图片水印时使用的参数。 可以在添加水印图片进行预处理操作,包括设置缩略、旋转图片和剪切图片,但不支持剪切为内切圆。进
是否支持生僻字识别,少数民族字体识别 支持部分生僻字识别。 不支持少数民族语言文字识别。 父主题: API使用类
人脸识别所需最低带宽是多少 图片大小和并发都由客户控制,可根据自己业务情况选择宽带大小,人脸识别没有对宽带做最小限制。 父主题: API使用类
调用指南 评估模板应用后,就完成模板制作,开发属于自己的文字识别应用,此应用用于识别自己所上传的图片属于哪种模板以及识别图片中的文字。 前提条件 已在自定义OCR控制台选择“多模板分类工作流”创建应用,并完成评估模板步骤,详情请见评估. 操作步骤 在“应用开发>调用指南”页面完成
单击图标重置图片为初始状态,即未进行任何处理的状态。 :单击图标,在“图片裁剪”窗口调整图片裁剪范围,然后单击“裁剪”,调整图片的大小。 :单击图标,在“图片旋转”窗口,鼠标选中调整图片的方向,然后单击“确认”,调整图片的方向。 :单击图标,向左旋转图片90°。 :单击图标,向右旋转图片90°。 :单击图标,缩小图片大小。
可自动获取该发票的识别与验真结果,以发票文件名称为前缀的JSON文件存储: 图3 获取识别结果文件 通过华为云SDK使用 企业业务系统可通过华为云提供的SDK服务与OBS桶进行对接,当员工上传发票图片或者电子发票PDF文件到华为云OBS桶后,即可自动进行文字识别和验真,企业业务系
行业套件介绍 文字识别套件基于丰富的文字识别算法和行业知识积累,帮助客户快速构建满足不同业务场景需求的文字识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件的介绍请参见产品介绍。 预置工作流 文字识别套件当前提供了单模板工作流和多模板工作流,自主构建文字识别模板,识别模板图片中
触发类型:设置提示信息的触发类型,可以选择坐标轴和数据项。 颜色:设置提示信息的字体颜色。 字号:设置提示信息的字号大小。 字体粗细:设置提示信息的字体粗细样式。 动画 显示/隐藏提示信息:单击“动画”右侧的勾选框,表示开启图表的动画效果;表示预不开启图表的动画效果。 入场动画:组件第一次渲染动画的时长,单位为ms。
详细操作指导 个人账号 人脸识别认证(即时完成认证) 请参见如何进行人脸识别认证。 银行卡认证(即时完成认证) 请参见如何进行银行卡认证。 证件认证(1-3个工作日) 请参见如何进行证件认证。 企业账号 推荐对公账户打款认证(最快30分钟) 请参见如何进行对公账户打款认证。 企业法定代表人手机号认证(即时完成认证)
云空间怎么批量下载文件和图片? 方法1:进入“业务 > 云空间 > 我的文件”,点击右上角“多选”,选择需要下载的文件和图片,点击“缓存”即可下载。 方法2:进入“业务 > 云空间 > 团队空间”,选择团队,点击右上角“多选”,选择需要下载的文件和图片,点击“缓存”即可下载。 父主题:
文件名规范,不能有中文,不能有+、空格、制表符。 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 不要把明显不同的多个任务数据放在同一个数据集内。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 每一类数据
OBS/MINIO/OBJECTSTORAGEPROXY图片库,支持按目录管理图片: 单击目录后的和,新增根图片目录和子图片目录。 单击“上传图片”,可上传图片。 选中图片时,单击,可以在图片库中删除此图片。 预览:预览时,是否支持单击放大图片。 公共 控件名称:当前组件的名称。 隐藏:是否隐藏该组件,此
支持按照相对质量和绝对质量对jpg格式的图片进行压缩,压缩后的图片画质降低,占用的空间变小,在对图片质量要求不高的场景下可以节省流量、减少加载时间。 控制台代码编辑 接口调用 图片瘦身 支持在图片画质基本不变的情况下对图片进行瘦身,减小图片占用的空间,此功能可以在不影响图片质量的情况,有助于节省获取图片导致的流量开销,提升终端加载速度。
回识别的文字和坐标。 驾驶证识别 识别驾驶证图片中主页与副页的文字内容,并返回识别的文字和坐标。 护照识别 识别护照首页图片中的文字信息,并以JSON格式返回识别的结构化结果。 银行卡识别 识别银行卡上的关键文字信息,并以JSON格式返回识别的结构化结果。 营业执照识别 识别营业
一句话识别 支持“华北-北京四”、“华东-上海一”区域。 当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。