已找到以下 10000 条记录
  • AI训练营|基础课第四讲(上)

    文字识别(OCR)是被广泛使用的技术例如证件类OCR、通用类OCR、票据类OCR而传统的OCR拥有容易受背景干扰适用场景单一、精度难提升等缺点那么OCR+AI将会给OCR带来怎样的新生呢?请听本期由美貌与技术并存的cheri及Authur博士为大家带来的课程 文字识别技术“之传统

    作者: llu
    5605
    0
  • hilens studio算法yolov3-darknet53 训练模型,编写代码后,视频输出的物体类别对应关系完全不对应

    数据集是网上开源的voc2007,大概有5000张图片,使用AI市场的算法yolov3-darknet53在modolarts上  训练模型,转换成om后导入hi lens studio,编写代码后,视频输出的物体类别对应关系不对,猫和狗识别成鸟,几乎没有几个识别对的  debug和运行都没有问题

    作者: 临秋白
    847
    9
  • 人工智能概述

    问题。比如在做OCR(文字识别)任务时,传统机器学习算法,一般要对原始图片进行灰度化、二值化、降噪、文字切分、文字识别等一步步操作。而如果用某些深度学习算法(如CRNN-CTC),则可以实现端到端的解决问题,直接传入一张图片,经过模型学习之后直接识别文字。7.5. 可解释性不同

    作者: stone3005
    9667
    0
  • OpenLayers地图 - 华为云Astro大屏应用

    图片宽度:设置图片的宽度。为空时,宽度按图片比例显示,宽高都为空时按图片原始大小显示。 图片高度:设置图片的高度。为空时,高度按图片比例显示,宽高都为空时按图片原始大小显示。 图片比例:设置图片的宽高比,即图片的宽度与高度的比值 上下偏移:设置图标根据点经纬度的上下偏移。 左右偏移:设置图标根据点经纬度的左右偏移。

  • 《鸿蒙Next:筑牢人工智能敏感数据脱敏的安全防线》

    发现可能存在的敏感数据泄露风险并及时处理。 应用场景下的特殊脱敏措施 在图片处理方面,鸿蒙Next支持图片脱敏,可去除图片的位置信息、拍摄数据等敏感内容。比如用户分享图片时,开启相关功能就能避免他人获取图片中的敏感信息。对于语音数据,可在AI处理前,利用系统的音频处理功能对敏感词

    作者: 程序员阿伟
    发表时间: 2025-01-14 12:53:57
    0
    0
  • Spring Boot 使用 Hutool Captcha + Vue 实现图形验证码

    绘制图形验证码:将上述字符序列画成一幅图形,通常带有干扰线以增加识别难度。 返回验证码给客户端:生成的验证码图片通过 HTTP 响应传回给客户端。 客户端显示验证码:在客户端通过 HTML 标签展示该图片。 用户输入验证码:用户识别图片中的字符并在输入框中输入。 验证用户输入:将用户输入与服务器保存的字符进行比对,判断正确性。

    作者: 鱼弦
    发表时间: 2025-01-04 09:29:19
    0
    0
  • 6小时模型迭代的背后故事:华为云ModelArts+HiLens在空管领域怎么用?

    平台的技能市场上找到了一个成熟的多路识别程序。经过简单修改,麦图就以此为基础实现了一个 C++ 的识别模块。进一步,团队又通过将 API 改为 Socket 接口、减小采集图片大小的方式来降低单帧处理耗时,最终实现了每秒 20 帧的输出目标。为确保图像识别结果框与管理界面显示的监控画面稳定对齐,麦图选择由

    作者: HWCloudAI
    发表时间: 2020-11-20 16:17:22
    8660
    0
  • Python—OpenCV创建级联文件(Windows7/10环境)

    通常负样本数据集是识别物体的背景环境照片,图片越多越复杂抗干扰能力越强,负样本图片可以不用裁剪为固定大小,但是为了提升训练速度建议进行合理裁剪。 正样本图片如下:  负样本图片如下:  为了操作方便,我写了Python程序实现批量调整图片数据大小和图片命名,具体如下: # -*-

    作者: 不脱发的程序猿
    发表时间: 2020-12-28 00:17:00
    2917
    0
  • Python—OpenCV创建级联文件(Windows7/10环境)

    通常负样本数据集是识别物体的背景环境照片,图片越多越复杂抗干扰能力越强,负样本图片可以不用裁剪为固定大小,但是为了提升训练速度建议进行合理裁剪。 正样本图片如下:  负样本图片如下:  为了操作方便,我写了Python程序实现批量调整图片数据大小和图片命名,具体如下: # -*-

    作者: 不脱发的程序猿
    发表时间: 2021-01-01 00:51:23
    3170
    0
  • RFID与NFC技术区别与联系

    域中同时出现多个射频标签的情况,从而提出了多标签同时读取的需求。目前,先进的射频识别系统均将多标签识读问题作为系统的一个重要特征。超高频标签主要用于铁路车辆自动识别、集装箱识别,还可用于公路车辆识别与自动收费系统中。从频段划分可以看出来,NFC在频段上,属于RFID众多频段中的一

    作者: 月饼!@#%&()zz
    发表时间: 2020-05-25 19:31:54
    13063
    0
  • 超图二三维一体化桌面GIS软件

    企业级插件式桌面GIS软件,可对空间地理信息数据进行入库、更新、维护、数据信息的展示及日常管理。可将业务数据进行空间化处理,承担地图服务发布前的准备工作。规格1:iDesktop .NET标准版 支持空间数据引擎SDX+管理文件数据和数据库数据;支持数据导入导出、类型转换、数据浏

    交付方式: License
  • 一个基于百度飞桨封装的.NET版本OCR工具类库 - PaddleOCRSharp

    Character Recognition)工具可以将图像或扫描文件中的文本内容转换成可编辑的文本格式。这项技术可以帮助人们快速准确地将扫描文件、图片中的文字提取出来,从而进行编辑、存储和分析。 百度飞桨PaddleOCR介绍 PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库

    作者: 追逐时光者
    发表时间: 2023-11-25 10:02:44
    5
    0
  • 【API进阶之路】太秃然了,老板要我一周内检测并导入一万个小时的视频

    上回说到,老板奖励7天带薪假,我就回家玩耍了几天,顺便还帮兄弟发不脱当了一回“AI大神”。(回顾:《没有AI工程师也能做OCR文字识别》)假期结束后回来上班,走进电梯都有一种特别的感觉,电梯某植发广告里的大哥看我的眼神好像和之前不太一样…到公司开了第一个会,原来,那个眼神像是一个

    作者: Cynthia成
    2540
    3
  • 【API进阶之路】太秃然了,老板要我一周内检测并导入一万个小时的视频

    上回说到,老板奖励7天带薪假,我就回家玩耍了几天,顺便还帮兄弟发不脱当了一回“AI大神”。(回顾:《没有AI工程师也能做OCR文字识别》)假期结束后回来上班,走进电梯都有一种特别的感觉,电梯某植发广告里的大哥看我的眼神好像和之前不太一样…到公司开了第一个会,原来,那个眼神像是一个

    作者: Cynthia成
    5223
    1
  • 内容动态分析 - 应用平台 AppStage

    指标名称 指标描述 操作类别次数 统计周期内,总操作次数与操作类别数的比值。 内容动态类型数量 统计周期内,发布成功的各类别内容动态的条数(文字图片、视频)。 使用建议 操作类别次数可以帮助我们了解用户在使用产品时的行为习惯,从而优化产品设计和用户体验。 内容动态类型数量可以帮助我们

  • 使用AstroZero创建高级页面适配多终端显示 - 华为云Astro轻应用

    存放商品图片,此处存放了10张商品图片,分辨率统一为380x440,如图3所示。 图3 新建img存在商品图片 在commodityListWidget.js中,新建Commodity对象并为其赋值。 其中,Commodity对象包含三个属性,分别为src(商品图片路径)、ti

  • 《鸿蒙Next:让人工智能应用自适应不同屏幕,畅享极致体验》

    代码,从而实现更精准的自适应显示。 矢量图与多套图片资源的运用 为了确保图片在不同设备上都能清晰显示,开发者可以采用多套图片资源或矢量图。对于一些重要的图标和图片,提供不同分辨率下的版本,系统会根据设备的屏幕分辨率自动加载合适的图片。而矢量图如SVG则具有无损放大和缩小的优势,无

    作者: 程序员阿伟
    发表时间: 2025-01-19 23:13:24
    0
    0
  • 关于二分类学习笔记

    classification)的算法。首先我们从一个问题开始说起,这里有一个二分类问题的例子,假如你有一张图片作为输入,比如这只猫,如果识别这张图片为猫,则输出标签1作为结果;如果识别出不是猫,那么输出标签0作为结果。现在我们可以用字母 来 表示输出的结果标签,如下图所示:

    作者: 运气男孩
    1229
    2
  • 功能描述

    100M的图片水印。 音频提取 支持提取视频文件中的音频文件,暂只支持提取MP3格式的音频。 视频截图 支持对视频文件进行截图,生成JPG格式的图片文件。

  • 关于华为云的OCR问题,就是关于华为云的OCR能否支持二次开发的呢?

    CR demo去测试了其中的一些PDF文档去测试一下能否识别到我们的一些文档的内容,就是我们纸质的合同扫描成一个PDF文档,然后PDF转成文字,然后看能否支持文字信息跟OA系统上的电子合同信息进行对比,但是目前OCR只有识别的功能,没有对比功能,这样能否支持二次开发,可以支持对比的呢?大家一起沟通一下吧~

    作者: andyleung
    1339
    1