内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 多模态大模型:识别和处理图片与视频技术详解

    多模态大模型:识别和处理图片与视频技术详解 随着人工智能和深度学习技术快速发展,多模态大模型在识别和处理图片与视频方面展现出了强大能力。多模态大模型能够处理多种形式数据,包括文本、图像、视频、音频等,从而实现更智能、更全面的理解与应用。本文将详细介绍多模态大模型是如何识别和处理图片与视频的。

    作者: 牛哄哄的柯南
    发表时间: 2024-06-13 14:48:13
    50
    0
  • 中文版文字生成图片操作指南

    注意:中文提示词之间需要用英文逗号隔开! 6.海报生成和分享 如下图所示填写“作品名称”和“作者名”生成海报 7.下载生成图片 点击左上角图标,确保是图片目录,点击图片“AI_paint_output.png&

    作者: 雨落无痕
    发表时间: 2023-04-28 19:12:15
    247
    1
  • HarmonyOS之AI能力·通用文字识别技术

    理想识别结果,调用通用文字识别功能时,应尽可能保证输入图像具有合适成像质量(建议720p以上)和高宽比例(建议2:1以下,接近手机屏幕高宽比例为宜)。当输入图像为非建议图片尺寸时,文字识别的准确度可能会受到影响。为保证较理想识别结果,建议文本与拍摄角度夹角在正负30度范围内。

    作者: Serendipity·y
    发表时间: 2022-02-16 17:24:53
    1041
    0
  • 文字识别基础知识】中文识别 - 成功率决定因素

    决定因素 1.图片质量,一般建议150dpi以上 2.颜色,一般对彩色识别很差,黑白图片较高,因此建议ocr为黑白tif格式 3.最重要就是字体,如果是手写识别率很低。 国内OCR识别简体差错率为万分之三,如果要求更高精度需要投入更大的人工干预。繁体识别由于繁体字库不统一性

    作者: 某地瓜
    1951
    0
  • 使用卷积神经网络识别手写数字图片——tensorflow部署

    由于数据比较简单,所以用到模型不是很复杂,使用了两层卷积层和两层全连接层共四层网络,其中卷积层均采用5x5卷积核,并带有2x2池化,训练迭代次数为3000次,学习率为1∗e−51*e^{-5}1∗e−5,每一次喂进去50张图片,训练集共60000张图片,测试集共40000张图片。 2.流程

    作者: Y_K_C
    发表时间: 2021-10-10 12:53:39
    1440
    0
  • 小白之了解文字识别之通用类

    功能介绍通用表格识别提取表格内文字和所在行列位置信息,适应不同格式表格。同时也识别表格外部文字区域。用于各种单据和报表电子化,恢复结构化信息。通用文字识别提取图片文字及其对应位置信息,并能够根据文字图片位置进行结构化整理工作。手写文字识别识别文档中手写文字信息,并将

    作者: 建赟
    2248
    1
  • 云脉OCR文档识别图片快速转换成电子文档

    用,OCR文字识别工具逐渐被人们所熟知,让我们有了更便利方式可以代替人工手动录入。在OCR技术领域颇有建树厦门云脉技术有限公司,基于自身成熟OCR技术推出文档识别工具,提高海量纸质文档录入和管理效率。云脉文档识别作为一项成熟的人工智能识别工具,可以在短时间内识别和读取纸质

    作者: 云脉OCR技术
    发表时间: 2020-10-12 16:12:12
    5800
    0
  • 文字识别之关键信息提取

    更佳阅读体验,请移步【原创】技术综述十:文字识别之关键信息提取 【摘要】从文档中提取结构化关键信息,为文档自动化处理提供了基础,成为日益增加业务需求。近年来,利用文档图片视觉、上下文等信息来进行文档关键信息提取受到学术界和工业界广泛关注。深度学习模型已经在OCR领域,包括文本检测和文本识别任务,获得

    作者: llu
    5771
    0
  • 文字识别基础知识】OCR概念

    Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印字符,通过检测暗、亮模式确定其形状,然后用字符识别方法将形状翻译成计算机文字过程; 即,针对印刷体字符,采用光学方式将纸质文档中文字转换成为黑白点阵图像文件,并通过识别软件将图像中文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

    作者: 某地瓜
    2367
    0
  • 手写文字识别基本无法识别HWDB测试用例

    这写字单独图片都是无法识别

    作者: HWTESTER
    3189
    2
  • post/animalDetect/index 根据图片识别动物 - API

    该API属于APIHub22579服务,描述: 根据上传动物图片,识别动物信息。接口URL: "/animalDetect/index"

  • 我用开天平台做了一个“网络图片文字识别”小工具【开天aPaaS大作战】

    huaweicloud.com/markets/apaas/api.html 因为此次工具功能是关于“识别网络图片文字,我们在API商品云商店里选择图像识别,然后在该类别里选择“OCR网络图片文字识别”产品:https://marketplace.huaweicloud.com/

    作者: gentle_zhou
    发表时间: 2022-08-06 16:04:22
    697
    0
  • 零基础使用 开天集成工作台 创建图片文字快速识别流应用【华为云开天aPaaS】

    什么是开天集成工作台 MSSI 开天集成工作台MSSI是一个助力企业应用创新开放集成平台。它基于元数据、可配置集成框架,汇聚丰富集成资产以及开发工具,帮助企业实现业务流程自动化,连通企业内外应用孤岛,以及创新应用高效(低代码)开发。 使用方法 进入工作台 首先进入开天集成工作台

    作者: 福州司马懿
    发表时间: 2023-10-07 18:13:39
    56
    0
  • ImageData格式图片如何保存

    uint32_t size = 0;    std::shared_ptr<uint8_t> data;};例如,在人脸检测样例中,如何识别结果存成图片呢?https://gitee.com/ascend/samples/tree/master/facedetection

    作者: 公子沁
    947
    1
  • 请教关于caffee模型转换om后,无法识别图片内容问题

    请教一个omg转换模型问题。我这边使用caffee模型,输入256 * 256灰度图片,进行训练。我们应用程序流程是:1 接收原始灰度图片 256 * 256。2 调用acl接口,将其转换成 256 * 256 yuv420图片。3 送到模型推理接口,调用 aclMdlEx

    作者: 九评
    1560
    10
  • 云端OCR识别 SaaS平台开启文字识别新渠道

    机会搭上信息化列车。云脉OCR SDK开发者平台是一个集证件识别、名片识别、车牌识别、行驶证识别、文档识别、票据识别等众多识别功能于一体技术接入平台。用户只需注册登录便可获得免费试用福利,云脉SaaS平台接受各个企业试用考验,也有自信能够给予企业优质满意服务。在行业中摸

    作者: 云脉OCR技术
    发表时间: 2019-02-20 16:46:10
    9841
    0
  • iOS开发之实现毛玻璃效果及图片模糊效果

    0之前还是有系统类可以实现毛玻璃效果, 就是 UIToolbar这个类,并且使用简单,实现起来也很简洁。 创建一个UIToolbar实例,设置它frame或者也可以通过添加约束;UIToolbar有一个属性:barStyle,设置对应枚举值来呈现毛玻璃样式,最后再添加到需要进行毛玻璃效果的view上即可。

    作者: Serendipity·y
    发表时间: 2022-02-16 15:45:15
    855
    0
  • 【转】文字识别系统原理及组成

    文字图像识别的原理如下图所示。 图中光电变换检测部分主要功能, 是对纸面上文字进行光电转换, 然后经模数转换成具有一定灰度数字信号, 送往其后各部分进行处理和识别。 常用检测设备是扫描仪, CCD 摄像头等。 文字图像分割目的就是根据文字图像特征视线文字图像区域

    作者: 极客潇
    1765
    1
  • Python爬虫抓取图片文字01编码

    弹性公网IP绑定完成,点击“登录”,输入用户名:root,密码:创建云数据库RDS时设置密码 创建数据表 在新建数据库右侧点击“新建表” 进入数据库“vmall”表管理页,点击“+新建表”,表名:“product”,其他参数默认 添加3个字段分别如下

    作者: 孙小北
    发表时间: 2022-08-31 13:27:16
    308
    0
  • 如何图片画框

    图片经过推理后得到AclLiteImage类型图片数据,如何在这个数据类型上画框(python版本),有没有相关接口或方法。

    作者: yd_220266783
    78
    5