内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 自动语音识别ASR

    自动语音识别(ASR,Automatic Speech Recognition)是一种语音识别技术,其目标是通过对人类语音信号的转换,将其中包含的语音内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。ASR的实现需要经过以下主要步骤:预处理(Pre-processin

    作者: 运气男孩
    54
    0
  • PDF 文字&表格识别转换 (四)

    PDF 文字&表格识别转换 (四)上回说到,我们已经总结了16种点集之间的相对位置关系,本回我们由这些位置关系出发将点集组成单元格(Cell),这里先对单元格进行下一个定义:单元格是一个被四个点集包围的最小区域,并且区域里不包含其他的点集。A Cell is an area surrounded

    作者: Ragnar
    1656
    0
  • 给浏览器加了一个语音搜索功能【玩转华为云】

    前言 随着物联网的发展,语音识别技术受到越来越多的关注,语音识别技术正积极推动信息通信领域的革命,语音拨号,语音邮件,语音输入,语音操控等以语音识别为基础的人机交互日益普及;尽管生物识别方式不断增多,语音识别方式任然是主流方式,与其他生物识别技术相比,语音识别技术不仅具有非接触,非

    作者: DS小龙哥
    发表时间: 2022-01-06 16:06:56
    1774
    1
  • 华为云语音识别应用

    使用服务:语音识别如何解决:引入华为云的语音识别技术"使用场景:语音文字,把采访视频中的语音生成文字。 业务架构图/方案截图:使用规模: 100小时/月提高工作效率:提高效率、节省了大量的人力成本,文字生成速度快、准确率高。建议: 方言识别能力弱,这个确实不好解决作者: 老杨

    作者: 老杨0311
    6228
    4
  • PDF 文字&表格识别转换 (三)

    # PDF 文字&表格识别转换 (三) [上回](https://bbs.huaweicloud.com/forum/thread-54570-1-1.html)说到PDFMiner已经返回了*objects*左上角(x0,y0)和右上角(x1,y1)坐标信息的四元元组*bbo

    作者: Ragnar
    2459
    0
  • 人工智能 - 语音识别

    Ⅰ  需要多种算法将语音转换为文本并准备进行数字处理。尽管语音识别系统变得越来越好,但是即使是当今最好的语音识别系统也仍然容易出错,因此在安全关键型应用(例如医疗数据捕获)中需要进行一些验证。Ⅱ  贝尔实验室的研究人员于1952年开发了首个用于识别单个数字的语音识别系统。到1962年

    作者: 斑馬斑馬
    438
    0
  • 语音识别】基于matlab DWT算法0~9数字语音识别【含Matlab源码 1726期】

    [摘 要]以一个能识别数字0~9的语音识别系统的实现过程为例,阐述了基于DTW算法的特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现的详细讨论,最后给出了在Matlab下的编程方法和实验结果。 1语音识别系统概述 语音识别系统的典型

    作者: 海神之光
    发表时间: 2022-05-28 16:58:01
    468
    0
  • 浅谈ASR语音识别

    语音识别(Automatic Speech Recognition,ASR)是一种将人类语音信号转换为文本或命令的技术。其基础原理涉及到声学特征的提取、声学模型的建立和语言模型的应用。以下是ASR的基础原理:1. 声学特征的提取ASR的第一步是从语音信号中提取特征,这通常涉及以下几种技术:短时能量和短时过零率:

    作者: 运气男孩
    22
    1
  • 语音识别】基于matlab GUI语音识别信号灯图像模拟控制(带面板)【含Matlab源码 757期】

    是仅仅转换为书面文字。本案例以语音识别为理论基础,通过与模式识别相结合的方式将其应用到信号灯图像的模拟控制领域,实现对指定语音信号进行自动识别并自动关联信号灯图像的效果,具有一定的使用价值。 2 理论基础 语音信号的端点检测是进行语音识别的一个基本步骤,它是特征训练和识别的基础

    作者: 海神之光
    发表时间: 2022-05-28 17:40:56
    364
    0
  • DFCNN + Transformer模型完成中文语音识别(一)

    Transformer模型完成中文语音识别 语音识别,通常称为自动语音识别,(Automatic Speech Recognition,ASR),主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,也有可能是二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称语音转文本识别(

    作者: HWCloudAI
    发表时间: 2022-12-19 03:37:26
    559
    0
  • 语音识别的问题

    你好,我有两个问题:1.ASR语音识别有没有四川话版本?2.四川话版本和普通话是可以自动识别转换还是需要手动切换?因为通话过程中,经常会有前一句是四川话后一句是普通话的情况。

    作者: lola@HWCloud
    3689
    1
  • 语音识别

    作者: 宝哥哥
    527
    0
  • 【Manas引擎】图像识别图片在线识别getpicinfo_online的使用方式 OCR在线识别图片USER ID Token

    H3mJJt设计器中如下控件可使用上面的信息用于测试使用。getpicinfo_online在下图的链接里,对于习惯于老版本里的识别率且不满足当前识别结果的开发者可以试试把这里的v3修改成v2。

    作者: This is WeAutomate
    1922
    0
  • 语音识别语音控制的原理介绍

    向右转”、“向前走”、“向后退”命令词,语音算法sdk经过智能处理后输出识别结果,log显示如下 ​ 识别语音命令词“向前走”、“向左转”、“向右转&rd

    作者: 二哈侠
    发表时间: 2024-09-19 23:20:30
    145
    0
  • kaldi语音识别

    kaldi语音识别 chain模型的数据准备https://bbs.huaweicloud.com/blogs/180841kaldi语音识别 chain模型的训练流程https://bbs.huaweicloud.com/blogs/180842

    作者: void0
    2820
    0
  • 语音识别未来

    STM等自适应技术i-vector、AEC等语言模型N-gram、word2vec等语音识别难点远场麦克风识别高噪音场景语音识别多人语音识别交谈背景语音识别非标准语音识别(变速,带有情绪等)未来展望更优的算法与模型更先进的麦克风阵列技术更先进的声学模型与范

    作者: G-washington
    1295
    1
  • 语音识别】基于matlab VQ特定人孤立词语音识别【含Matlab源码 536期】

    基于VQ的方法比较简单, 实时性也较好。因此,直到目前为止,基于VQ的说话人识别方法,仍然是最常用的识别方法之一。 应用VQ的说话人识别系统如图8-3所示。完成这个系统有两个步骤:一是利用每个说话人的训练语音,建立参考模型码本;二是对待识别话者的语音的每一帧和码本码字之间进行匹配。由于VQ码本保存了说话

    作者: 海神之光
    发表时间: 2022-05-28 20:01:16
    292
    0
  • 【转载】语音语音识别介绍

    一、语音领域知识介绍 音频特征音频数据常见音频任务二、语音识别知识介绍技术历程语音识别的流程声学模型语言模型语音识别的挑战三、音频数据读取与处理

    作者: emilyleungbaby
    1147
    1
  • 语音识别】基于matlab电话按键语音识别(含按键录音)【含Matlab源码 1752期】

    一、获取代码方式 获取代码方式1: 完整代码已上传我的资源:【语音识别】基于matlab电话按键语音识别(含按键录音)【含Matlab源码 1752期】 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    作者: 海神之光
    发表时间: 2022-05-28 16:49:19
    465
    0
  • 语音识别技术属于什么技术

    一、语音识别技术属于什么技术语音识别技术属于人工智能领域的一个重要分支。语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其主要目标是把人类的语音内容转换为计算机可读的格式,如文本、按键或字符序列。这项技术涉及多个学科,包括

    作者: DevFeng
    30
    1