已找到以下 10000 条记录
  • 实例分割-Mask R-CNN 模型

    1.29134 float32 6.3 第三步:测试其他图片。 本目录下的data/val2014目录下有很多测试图片,修改下面代码中test_path变量右边的文件名,即可更换为不同图片,测试图片的预测效果。 test_path = './data/val2014/

    作者: HWCloudAI
    发表时间: 2022-11-22 03:00:58
    366
    0
  • 昇思大模型体验平台实践经典CNN网络Lenet【云端实践】【秋招特训】

    于Lenet的手写字体识别”进行学习。 这个也是保姆级,不单有算法的描述,还有论文的连接,样例仓的demo,点击wesley/lenet5_demo蓝色的链接可以直接体验。 在左边手写数字,点击Submit ,就可以直接通过lenet进行识别。 Lenet实践 当

    作者: madqfrog
    发表时间: 2022-09-06 11:42:52
    234
    0
  • 基于自定义模板的OCR开发流程“ModelArts人工智能应用开发指南” 学习笔记

    3)选择识别区并不是图片中的所有字段都需要识别,因此需要根据业务需求选择区别,并对识别区内字段命名,从而建立“建-值”字段的对应关系。可以在模板图片上选择需要识别的字段,值得注意的是,选择识别区时应尽量扩大识别区范围,以防止漏检。4)评估和发布模板在正式部署之前,需要对模板进行评

    作者: QGS
    5168
    4
  • Bags of Binary Words for Fast Place Recognition in Image Sequenc

    张图像的序列中每帧需要 22ms,比以前的方法快一个数量级。 索引词——地点识别、词袋、SLAM、计算机视觉。 一、介绍 长期视觉 SLAM(同时定位和地图构建)最重要的要求之一是鲁棒的位置识别。经过一段探索期后,当重新观察长期未观察到的区域时,标准匹配算法就会失败。当它们

    作者: 振华OPPO
    发表时间: 2022-06-29 09:04:41
    604
    0
  • 什么是票据类OCR

    支持纹理、盖章、文字重叠等复杂背景的医疗发票识别 识别精度高 采用先进的深度学习算法,优化业务场景,文字识别精度高 文字识别 OCR 文字识别OCR提供在线文字识别服务,将图片或扫描件中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。 产品详情立即注册一元域名华为云桌面

  • 【我与ModelArts的故事】基于ModelArts实现场景化AI图像垃圾分类体验

    使用刚才训练好的模型,在验证集上尝试做一次推理,首先初始化配置。 这里演示如何推理一张图片,如果想要推理多个图片,可以将img_path修改为一个路径,那么就会推理这个路径下的所有图片了。   3.2.10、在线推理 使用TorchServing   启动服务 配置jdk环境变量

    作者: y-wolfandy
    发表时间: 2023-04-22 22:55:08
    82
    0
  • stable diffusion 提示词进阶语法-学习小结

    (一个女孩,一个男孩,在街上走路) 很大概率出来的是一个拼接组合的奇怪图片,不会是两个人(因为提示词中没有明确说明要几个人) 解决方案: 2girls 直接要求要2个人物 或者 2people(1girl and 1boy) 使用注释,翻译为:一个女孩和一个男孩2个人 2characters(1girl

    作者: yd_266875364
    发表时间: 2024-06-03 15:01:20
    5
    0
  • 实训说明书 在线音乐平台项目规格说明书

    在线音乐平台项目规格说明书 概况   项目名称 在线音乐平台 行业 网络媒体 架构类型 B/S结构

    作者: tea_year
    发表时间: 2021-12-22 15:22:48
    231
    0
  • chrome开发者助手插件v2.10发布,提升开发效率不再只是口号

    p;   在这里插入图片描述 4. 支持从书签导入网址到桌面 在这里插入图片描述鼠标悬浮时,显示操作菜单,点击“+”或者“添加”可以把网址添加到桌面。点击编辑可以修改名称或图片在这里插入图片描述5. 其他优化 本次还有其他

    作者: bus
    发表时间: 2021-04-18 14:39:56
    1614
    0
  • 华为云AI实战营-图像分类

    包括图像分类、物体检测、图像分割、人脸识别、OCR、视频分析、自然语言处理和语音识别这八大热门AI领域的基础知识、经典数据集和经典算法的介绍

    主讲人:华为云专家
    直播时间:2020/05/26 周二 19:30 - 20:30
  • K-means 寻找图像主体颜色

    s算法,提取图片中的主体颜色”,找到图片中的显著颜色。今天突发奇想,能不能把k-means用于图片压缩呢?对图像rgb三个通道进行聚类,得到中心点像素,并填充对应的类别区域,我找来了一张上海的图片进行压缩。我的代码如下,由于在jupyte编辑器上写的代码,因此显示图片使用的matplotlib模块numpy

    作者: 技术火炬手
    发表时间: 2019-08-09 14:30:17
    5768
    0
  • 定额发票识别ocr

    【定额发票ocr】定额发票识别能力可以对定额发票上的发票号码、发票代码、发票金额进行结构化识别。口碑商家,品质保障,金牌售后。数据准确,价格优惠,响应迅速

    交付方式: API
  • 概述 - 语音交互服务 SIS

    表1 实时语音识别接口说明 接口类型 说明 实时语音识别接口 华为云提供的Websocket接口,主要用于实时语音识别。音频分片传输,服务器端可以返回中间临时转写结果,在最后返回最终转写结果。 表2 一句话识别接口说明 接口类型 说明 一句话识别 一句话识别接口,用于短语音的

  • 文本审核能直接上传word文件进行审核吗? - 内容审核 Moderation

    文本审核能直接上传word文件进行审核吗? 文本审核不支持word文件直接上传,只能通过调用API接口的方式,分析并识别用户上传的文本内容是否有敏感内容,并将识别结果返回给您。调用方法请参考《内容审核-文本入门》。 建议您先把word文件中字符串提取出来 ,然后分批、分字段调用服务的API接口,进行文本审核。

  • YOLO 施工安全帽目标检测模型

    在线工具推荐:三维数字孪生场景工具 - GLTF/GLB在线编辑器 - Three.js AI自动纹理化开发 - YOLO 虚幻合成数据生成器 - 3D模型在线转换 -  3D模型预览图生成服务

    作者: yd_217961358
    发表时间: 2023-11-16 14:42:45
    33
    0
  • 聚焦技术场景渗透 竞赛助力AI创意之花绽放

    无人驾驶、智能翻译、医疗影像辅助诊断……人工智能已经落地各行各业开花结果,并持续探索与更多应用场景的结合。此次C4-AI大赛继续采用开放命题模式,鼓励高校学子思索与实践人工智能技术在工业、农业、医疗、文化、教育、金融、交通、生活、公益等行业领域的创意应用。回顾2020年,上届C4

    作者: QGS
    2851
    3
  • 汉王云-行驶证识别

    通过提交行驶证图片,智能提取行驶证图片信息,包括行驶证号、车牌号、有效期等所有信息,可以免去您人工校对录入行驶证信息的烦恼。vehicleCard接口 :行驶证普通版,返回正常的识别结果; vehicleCard_cropped接口:行驶证切图版,切图版在普通版基础上增加返回切边处理后的图片;

    交付方式: API
  • 如何配置智慧园区设施云页面的语言切换开关

    再显示,如图3所示。图3 语言切换模块检查翻译工作台配置切换多语言是需要确保对应的语言在翻译工台中已配置,否则IOC平台语言切换时界面无法显示对应的语言。检查步骤如下:用开发者账号登录AppCube平台。搜索菜单“翻译工作台”,进入翻译工作台配置页面。检查操作栏支持切换的语言开关

    作者: 智慧园区刘师傅
    535
    0
  • 积水检测 - 视频智能分析服务 VIAS

    积水检测 输出JSON数据流到DIS指定的通道或者Webhook URL,包括告警结构化数据和图片数据。 当alert_mode字段设置为single时,结果示例: { "event_type":1900544, "task_id":"51d71bb66e6

  • 发送消息

    imageUrl String 图片文件的OBS路径。 imageCaption String 图片说明文字。