检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
识别服务,实现多种版式图像的文字信息结构化提取。 文字识别套件提供预置工作流供您选择,全流程可视化完成AI应用开发以及持续迭代。 选择预置工作流 单模板工作流 通过工作流指引构建文字识别模板,识别单个板式图片中的文字,快速实现文档、票证等场景的文字识别。详情请见使用单模板工作流开发应用。
银行卡识别:识别银行卡上的关键文字信息,并返回识别的结构化结果。 营业执照识别:识别营业执照图片中的文字信息,并返回识别的结构化结果。 商用 - 3 新增护照识别、道路运输证识别 护照识别:识别护照图片中的文字信息,并返回识别的结构化结果。 道路运输证识别:识别道路运输证中的文字信息,并返回识别的结构化结果。
API 媒资图像标签(分类) 媒资图像标签(检测) 名人识别 主体识别 翻拍识别 图像标签(V2)
申请服务 申请图像识别服务的具体操作步骤请参见《图像识别API参考》的“如何调用API > 申请服务”章节。
发言语言:选择发言的语言。单击下拉框可选择“中文”或“英文”。 字幕翻译语言:选择字幕翻译语言。单击下拉框可选择“自动(不翻译)”“中文”“英文”或“德文”。 双语字幕:勾选“同时显示双语”,字幕将同时显示发言语言和翻译语言。 图3 设置字幕 查看字幕记录 会中主持人、与会者可查看字幕记录,避免遗漏重点内容。
实时语音识别接口 接口说明 Websocket握手请求 实时语音识别请求 实时语音识别响应
图片/音频标注介绍 图片/音频标注是为数据工程师、数据科学家等提供的辅助标注工具。提供界面化数据查看、单点数据标注、保存标注结果、标注结果发布数据集等功能。可准确、高效、安全地完成各类型数据的标注任务,为客户提供专业的数据标注服务能力,助力客户高效开展算法模型训练与机器学习,快速提高AI领域竞争力。
处理图片 当图片上传后更新至hugb-bucket-input桶时,会生成事件,触发函数运行,将上传图片打水印,保存在hugb-bucket-output中。 上传图片生成事件 登录对象存储服务控制台,进入hugb-bucket-input桶对象界面,上传image.jpg图片,如图1所示。
准备环境 在使用图像识别SDK时,各语言需要准备的环境 参照表1。 表1 开发环境 开发语言 准备项 说明 JAVA 安装JDK JAVA环境开发配置,支持 Java JDK 1.8 及以上版本,推荐通过Maven 安装依赖的方式使用JAVA版本SDK。 PYTHON 安装python
提交录音文件识别任务 录音文件识别接口,用于识别长录音文件,支持中文普通话、四川话识别。录音文件放在OBS(对象存储服务)或公网可访问的服务器上。 由于录音文件识别通常会需要较长的时间,因此识别是异步的,即接口分为创建识别任务和查询任务状态两个接口。创建识别任务接口创建任务完成后
系统不保存用户图片或视频。 人脸检测/比对/搜索 人脸比对输入的两张图片总大小小于8MB。 图片大小小于8MB,由于图片过大会导致图片在网络传输过程中耗时较长,建议小于1MB。 图片分辨率小于4096*4096,图片中人脸像素大于80*80,建议120*120以上。 为保证识别效果,人脸图片建议要求如下:
计需要对应所检测图片的明显特征,并且选择的标签比较容易识别(画面主体物与背景区分度较高),每个标签就是对所检测图片期望识别的全部结果。物体的标签设计完成之后,基于设计好的标签准备该图片的数据,每种需识别出的标签,建议应在所有图片个数相加超过100张,如果某些图片的标签具有相似性,
图片文件进行图片剪切、图片缩放、图片水印、格式转换等处理。 更多关于图片处理的内容,参见图片处理特性指南。 以下代码展示了如何使用下载对象接口实现图片处理: // 初始化配置参数 ObsConfig config = new ObsConfig(); config.Endpoint
接口返回时间较长,如何提高响应速度 请检查图片的尺寸。若尺寸过大会导致图片在网络传输过程中耗时较长,建议在不改变图片质量的情况下对图片进行等比例缩放。 检查网络带宽是否稳定,是否存在网络波动,建议提升网络带宽避免网络时延较长。 父主题: 产品咨询类
在左侧导航树中选择“敏感数据识别 > 识别配置”,进入“识别模板”页签。 单击目标模板的“详情”进入模板详情界面。 单击列表选择规则,支持多选。 在规则列表左上角单击“修改分类”,在修改分类的弹框中选择目标分类。 单击“确定”,提示规则分类修改成功。 删除识别模板 内置模板和设置为默认的识别模板不支持删除。
在ModelArts数据集中添加图片对图片大小有限制吗? 在数据管理功能中,针对“物体检测”或“图像分类”的数据集,在数据集中上传更多的图片时,是有限制的。要求单张图片大小不超过8MB,且只支持JPG、JPEG、PNG和BMP四种格式的图片。 请注意,针对自动学习功能中的添加图片,其图片大小限制不同,要求上传的图片大小不超过5MB。
API概览 人脸识别服务所提供的API,均符合RESTful API设计规范,如表1所示。 表1 人脸识别API 类型 API 说明 人脸检测 人脸检测 人脸检测是对输入图片进行人脸检测和分析,输出人脸在图像中的位置、人脸关键属性。 人脸比对 人脸比对 人脸比对是将两个人脸进行比
查看调用次数 功能介绍 您可以在图像识别服务管理控制台上查看一段时间内服务的调用次数统计,帮助您更好了解服务的调用成功量和调用失败量。 操作步骤 登录图像识别服务管理控制台,在左侧导航栏中选择“概览”。 在概览页面中,您可以选择要查看的服务,设置时间范围,来观察这段时间内服务的调用次数变化情况,如图
概述 图像识别(Image Recognition),是指利用计算机对图像进行分析和理解,以识别各种不同模式的目标和对象的技术,包括媒资图像标签,名人识别,主体识别,翻拍识别,图像标签等。 图像识别以开放API(Application Programming Interface,
图像标签 功能介绍 图像标签服务准确识别自然图片中数百种场景、上千种通用物体及其属性。让智能相册管理、照片检索和分类、基于场景内容或者物体的广告推荐等功能更加直观。使用时用户发送待处理图片,返回图片标签内容及相应置信度。 URI URI格式 POST /v1.0/image/tagging