检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标注图片 用户对图片的某一些地方做标注,执行本章节。 操作步骤 按创建标注任务章节创建图片标注任务。 在图片左侧,单击,在待标注的图片上选中具体的标注对象画框。 在“标注名称”对话框输入标注的信息,单击“确定”。 在图片左上方,单击,在“确认”对话框单击“确认”,保存标注的内容。
如何提高识别速度 识别速度与图片大小有关,图片大小会影响网络传输、图片base64解码等处理过程的时间,因此建议在图片文字清晰的情况下,适当压缩图片的大小,以便降低图片识别时间。推荐上传JPG图片格式。 根据实践经验,一般建议证件类的小图(文字少)在1M以下,A4纸大小的密集文档大图在2M以下。
修改数据集的图片 当需要修改已发布数据集的图片时,执行此章节。 前提条件 数据集发布申请已审批通过。 登录用户为具有“Data Operation Engineer”角色的用户。 操作步骤 在数据集服务界面首页,单击需要修改的数据集,进入数据集详情页面。 选择“设置”页签。 单击“图片”。
添加图片时,图片大小有限制吗? 在数据管理功能中,针对“物体检测”或“图像分类”的数据集,在数据集中上传更多的图片时,是有限制的。要求单张图片大小不超过8MB,且只支持JPG、JPEG、PNG和BMP四种格式的图片。 请注意,针对自动学习功能中的添加图片,其图片大小限制不同,要求上传的图片大小不超过5MB。
传模板图片”、“定义预处理”、“框选参照字段”、“框选识别区”步骤,单击“下一步”,进入“评估”页面。 本地上传图片 图2 评估模板 在“应用开发>评估”页面,默认进入“本地上传”页签。 单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 测试图片上传成功后,右侧会显示识别结果。
请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 detect_direction 否 Boolean 是否校正图片的倾斜角度,可选值如下。 true:校正图片的倾斜角度 false:不校正图片的倾斜角度
视频文件名最大命名长度是多少? 您可以在上传视频时或者在“音视频管理”中对视频文件进行重命名,文件名最大长度为128个字节。若上传的文件名有空格,上传后将会去除命名中的空格。 父主题: 上传问题
“提取内容”为“文字”:单击“添加”选择待提取水印的图片。 图1 提取文字内容 “提取内容”为“图片”: 单击“选择文件”后的“添加”,选择需要提取水印的图片。 单击“存储目标路径”后的“添加”,选择存储提取的水印图片的路径。 单击“存储目标文件名”输入框输入提取的水印图片的文件名称。 图2
说明: 接口响应时间依赖于图片的下载时间,如果图片下载时间过长,会返回接口调用失败。 请保证被检测图片所在的存储服务稳定可靠,推荐使用OBS服务存储图片数据。 url中不能存在中文字符,若存在,中文需要进行utf8编码。 type_list 否 List 输入图片中,待识别票证的类型,
框选参照字段 在识别文字的过程中,套件会先对图片进行模板分类,再检查所识别图片与模板图片是否为同一种模板,并将识别图片校正后再提取结构化信息,支持图片平移、旋转与拉伸变换。 为了正确分类并校正待识别的图片,这就需要在模板图片中指定参照字段。通过参照字段的文字内容来判断识别图片属于哪一种模
图解文字识别
视图展示云空间文件。 如果文件为图片文件,卡片上展示图片的缩略图。 图2 卡片视图 单击图片缩略图,可展示图片原图。 在原图右上角,用户可进行放大缩小图片、下载或删除图片操作。 单击原图左侧图标,可查看上一张图片;单击原图右侧图标可查看下一张图片。 单击,关闭原图。 父主题: 文件预览
图片/音频标注介绍 图片/音频标注是为数据工程师、数据科学家等提供的辅助标注工具。提供界面化数据查看、单点数据标注、保存标注结果、标注结果发布数据集等功能。可准确、高效、安全地完成各类型数据的标注任务,为客户提供专业的数据标注服务能力,助力客户高效开展算法模型训练与机器学习,快速提高AI领域竞争力。
按钮内容:设置图片上传按钮的显示内容。 列表样式:设置图片的显示样式。 图2 文字 图3 图文 多选:是否支持上传多张图片。 最大上传文件个数:设置允许上传图片的个数。开启“多选”时,才需要配置。 例如,“最大上传文件个数”设置为“2”,设置后效果如下。当上传图片超过2个时,界面会提示“最多只能传输2个文件”。
上传测试图片或者上传在线图片,评估模板。 图4 评估模板 本地上传图片 默认进入“本地上传”页签,单击“上传图片”,或者拖拽测试图片至虚线框内上传图片区域,上传本地的图片作为测试图片。 上传图片后,右侧会显示文字识别结果,包括“识别区”和对应的“识别结果”。 上传在线图片 单击“
w黄色。 文字识别 识别图片上的文字信息,返回识别的文字和坐标。支持扫描文件、电子文档、书籍、票据和表单等多种场景的文字识别。 输入参数 用户配置文字识别执行动作,相关参数说明如表15所示。 表15 文字识别输入参数说明 参数 说明 图片文件 上传图片所在位置。 图片的URL路径
图片处理 开发过程中,您有任何问题可以在github上提交issue,或者在华为云对象存储服务论坛中发帖求助。 OBS为用户提供了稳定、安全、高效、易用、低成本的图片处理服务。当要下载的对象是图片文件时,您可以通过传入图片处理参数对图片文件进行图片剪切、图片缩放、图片水印、格式转换等处理。
图片文件进行图片剪切、图片缩放、图片水印、格式转换等处理。 更多关于图片处理的内容,参见图片处理特性指南。 以下代码展示了如何使用下载对象接口实现图片处理: // 初始化配置参数 ObsConfig config = new ObsConfig(); config.Endpoint
文字识别 文字识别连接器用于对接华为云文字识别服务,可以通过文字识别服务准确识别图像中的文字。 前提条件 使用文字识别连接器前,需要开通华为云文字识别服务。 创建文字识别连接 登录新版ROMA Connect控制台。 在左侧导航栏选择“连接器”,在连接器页面单击“新建连接”。 选择“华为云服务”类别下的“文字识别”。
image 否 String 该参数与url二选一。 图片的Base64编码,要求Base64编码后大小不超过10MB。 图片最短边不小于15px,最长边不超过4096px,支持JPEG、JPG、PNG、BMP、TIFF格式。 图片Base64编码示例如/9j/4AAQSkZJRgABAg