检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
若多识别出文字,可能是识别区太大,将周边无关的文字也框进来了,需将识别区改小一点。 若上述办法均无法解决,请检查识别区的文字是否发生了偏移,或者识别图片是否跟模板属于相同版式。 父主题: 常见问题
费,不执行不产生费用。 文字识别 OCR:提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。 人证核身服务 IVS:将用户本人与身份证信息关联起来,应用人脸识别与文字识别等技术,对接权威数据库,
这样的数据和算法生成的模型仅适用于教学模式,并不能应对复杂的预测场景。即生成的模型对预测图片有一定范围和要求,预测图片必须和训练集中的图片相似(黑底白字)才可能预测准确。 图8 示例图片 图9 预测结果展示 Step7 清除资源 如果不再需要使用此模型及在线服务,建议清除相关资源,避免产生不必要的费用。
API 智能文档解析 通用表格识别 通用文字识别 网络图片识别 智能分类识别 手写文字识别 印章识别 身份证识别 户口本识别 行驶证识别 驾驶证识别 护照识别 银行卡识别 营业执照识别 道路运输证识别 不动产证识别 车辆合格证识别 道路运输从业资格证识别 车牌识别 名片识别 VIN码识别
选择“账单管理>流水和明细账单>明细账单”,在如下图所示位置,获取资源名称和区域。 图1 资源名称和区域 单击左侧导航栏的图标,选择“人工智能 > 文字识别 OCR”。 进入文字识别“总览”页面。 选择资源所在的“区域”,单击对应的类别,进入产品列表。 单击对应产品操作列的“开通管理”,在对应账号的操作列单击“取消服务”。
如果“默认字段类型”不能满足您的业务需求,您可以创建新的字段类型。 前提条件 已在文字识别套件控制台选择“通用单模板工作流”新建应用,详情请见新建应用。 操作步骤 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。
页面上传图片,如图3所示。 上传图片至piccomp桶后OBS会自动生成事件触发工作流运行,将图片压缩。 触发器执行存在一定的延时,大概5分钟生效。 图3 上传文件 查看图片压缩效果 压缩后的图片存放在piccomp-output桶的output文件夹中。如图4所示,图片大小均有变小,实现了对图片的压缩。
图片 图片组件用于在页面展示图片。 在表单开发页面,从“通用组件”中,拖拽“图片”组件至表单设计区域,如图1。 图1 图片 显示名称:设置图片显示名称,默认隐藏显示名称。 选择图片:单击“上传图片”,上传需要展示的图片。 点击放大预览:勾选后,可放大预览图片。 移动端独立设置:勾选后,可给移动端单独设置展示的图片。
目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。 支持中英文以及部分繁体字。 API支持识别的图片版式依赖于创建自定义OCR工作流时的类型。 调用方法 请参见如何调用API。 前提条件 在使用之前,你需要通过OCR控制台,完成自定义OCR工作流的开发。开发、部署完成后,将在工作流的部署页面生成API的URI。
如何获取图片的base64编码 本节以Python为例,介绍如何将本地图片,转换为base64编码。您也可以使用在线的图片转base64工具。 使用时,需要将代码的d:\demo.jpg替换为实际图片路径。 import base64 with open("d:\demo.jpg"
传到对象存储服务的图片进行审核,识别图片中是否包含涉黄、广告、涉政涉暴、涉政敏感人物等违规内容,降低业务违规风险。解决方案架构图如下: 图1 方案架构图 该解决方案将会部署如下资源: 创建两个对象存储服务 OBS桶,一个提供给用户上传图片,另一个用于转储违规图片和存放审核日志;
OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流 FunctionGraph:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。 文字识别 OCR:提供发票识别与验真服务,识别用户上传的发票内容以及对接国税局系统进行真伪验证。
创建用于上传发票的OBS桶,企业业务系统将员工报销的发票图片或者电子发票PDF文件上传到该桶。 创建用于存储发票识别与验真结果的OBS桶,企业业务系统定时从该桶中获取结果并处理。 函数工作流:用于实现调用文字识别服务的业务逻辑,当OBS桶收到上传的发票文件后,会自动通知函数调用文字识别服务,并将结果存放到指定的OBS桶里。
终端节点章节查看。 例如OCR服务在“华北-北京四”区域的“endpoint”为“ocr.cn-north-4.myhuaweicloud.com”。 resource-path 资源路径,也即API访问路径。 从具体API的URI章节获取,例如网络图片识别API的“resour
字体颜色:设置图片标题的字体颜色。 字体粗细:设置图片标题的字体粗细。 长度(%):设置图片标题的长度。 宽度(%):设置图片标题的宽度。 上边距(px):设置图片标题与组件图层之间的上边距。 左边距(px):设置图片标题与组件图层之间的左边距。 对齐方式:设置图片标题的对齐方式,可设置为水平居中、左侧对齐、右侧对齐。
说明 使用方式 获取图片信息 获取图片的基本信息,包括:图片格式、大小、平均色值等。 接口调用 设置图片效果 支持对图片进行基础效果的设置,包括设置图片亮度、对比度,对图片进行整体锐化及模糊等处理。 控制台图形界面 控制台代码编辑 接口调用 图片缩略 支持对图片按照指定宽高和比例进行缩放。
配置公共读可参考《对象存储服务控制台指南》配置标准桶策略,创建桶策略为“公共读”。一般私密数据不建议用此方法。 “私有桶”策略(可选) OCR识别OBS私有桶中的图片时需要保证调用OCR服务的账号和调用OBS服务的账号为同一个。 使用临时授权请求鉴权 开启公共读授权访问,虽然使用比较方便,但若对于敏感
创建脚本,用于提交图片信息以及OCR接口识别图片内容。 在应用设计器中,选择“逻辑”,单击脚本后的“+”。 新建一个空白脚本,脚本名称为octTryTs。 图9 新建octTryTs脚本 在脚本编辑器中,输入如下示例代码。 //本脚本用于提交图片信息以及调用ocr接口识别图片内容 import
获取图片信息 此功能仅支持通过接口调用模式使用。 通过此操作可以获取到图片的基本信息:长、宽、以及文件的大小和格式。如果图片包含Exif信息,将按照json格式返回完整的Exif信息。 操作名称:info 示例 查询example.jpg信息。 https://e-share.obs
编辑应用 对于已经创建的模板应用,您可以修改模板的配置信息以匹配业务变化。 前提条件 已存在创建的模板应用。 编辑模板配置信息 登录“文字识别>自定义OCR”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。