内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    语音识别的问题可以看做是语音到文本的对应关系,语音识别问题大体可以归结为文本基本组成单位的选择上。单位不同,则建模力度也随之改变。

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • 语音识别的特殊之处

    语音识别发展到如今,无论是基于传统声学模型的语音识别系统还是基于深度学习的语音识别系统,语音识别的各个模块都是分开优化的。

    作者: 黄生
    31
    3
  • 语音识别技术属于什么技术

    一、语音识别技术属于什么技术语音识别技术属于人工智能领域的一个重要分支。语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其主要目标是把人类的语音内容转换为计算机可读的格式,如文本、按键或字符序列。

    作者: DevFeng
    30
    1
  • 语音识别模块的原理

    例如,现在的语音识别模块可以采用非特定人识别技术,使得系统能够识别不同人的语音;也可以结合深度神经网络等先进技术,提高识别的准确性和鲁棒性。语音识别前端处理,是语音识别系统中的一个重要环节,主要负责对原始语音信号进行处理和转换,以提取出对后续识别有用的特征信息。

    作者: DevFeng
    21
    1
  • 车载语音识别的算法

    车载语音识别系统主要采用自动语音识别(ASR)技术,而ASR算法又可以分为基于规则的算法和基于统计学习的算法。

    作者: 运气男孩
    32
    0
  • 语音识别】基于matlab动态时间规整(DTW)孤立字语音识别【含Matlab源码 573期】

    它采用的识别特征是BP FG(附听觉特征处理) , 匹配时采用DTW技术。其特点为:①在结构上基本沿用语音识别的系统。②利用使用过程中的数据修正原模板,即当在某次使用过程 中某说话人被正确确认时使用此时的输人特征对原模板作加权修改(一般用1/10加权)。

    作者: 海神之光
    发表时间: 2022-05-29 15:00:20
    308
    0
  • 人工智能:语音识别技术介绍

    语音识别的输入:对一段声音文件进行播放的序列。 语音识别的输出:输出的结果是一段文本序列。 3、语音识别的原理 语音识别需要经过特征提取、声学模型、语音模型、语音解码和搜索算法四个部分。

    作者: IT技术分享社区
    发表时间: 2022-11-29 13:34:33
    199
    0
  • 语音识别全链路

    语音识别全链路(Speech Recognition End-to-End)是一种将人类语音中的词汇内容转换为计算机可读的输入的技术。它主要包括语音的预处理、特征提取、声学模型和语言模型的训练以及解码和识别等步骤。语音合成和转写技术的工作原理主要是通过计算机对人类语言进行处理。

    作者: 运气男孩
    32
    0
  • 华为 语音识别,支持方言吗?

    华为 语音识别,支持方言吗?

    作者: 福州司马懿
    198
    5
  • 语音识别 识别结果非常差 解决思路

    Ⅰ  调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。Ⅱ  解决方案如下Ⅲ  检查音频采样率是否符合。Ⅳ  对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同的采样率,播放正常的即为音频正常采样率。

    作者: 我就是豆豆
    459
    0
  • 深度学习之语音识别

    数据集增强对语音识别任务也是有效的 (Jaitly and Hinton, 2013)。在神经网络的输入层注入噪声 (Sietsma and Dow, 1991) 也可以被看作是数据增强的一种方式。

    作者: 小强鼓掌
    831
    4
  • 语音识别失败问题咨询

    目前IVR导航中会出现asrerror,通过分析记录、日志、网络包后,发现华为设备并没有发送语音转写的信令给mrcp,之前也提供了mrcp主机端的抓包信息给华为,但华为的答复是mrcp少发了某条消息,麻烦华为的同志帮忙指出我们的mrcp少回复了什么消息。

    作者: lmm
    1256
    1
  • 语音识别】基于matlab傅立叶变换0-9数字语音识别【含Matlab源码 384期】

    (第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

    作者: 海神之光
    发表时间: 2022-05-28 21:04:17
    296
    0
  • 语音识别】基于matlab GUI动态时间规整算法(RTW)语音识别系统【含Matlab源码 341期】

    语音识别中, 一阶和二阶差分可以表示特征向量变化速度, 体现了语音的言语和韵律变化, 较好地描述了语音信号的动态特性。因此, 采用一阶和二阶差分倒谱参数来描述语音信号。 3 动态时间规整识别算法 前面的端点检测算法确定了语音信号的起点和终点。

    作者: 海神之光
    发表时间: 2022-05-28 16:44:19
    321
    0
  • MRCP协议-提供语音识别(ASR)与语音合成服务(TTS)

    MRCP协议(媒体资源控制协议)    媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种通讯协议,用于语音服务器向客户端提供各种语音服务(如语音识别语音合成

    作者: 隔壁老汪
    发表时间: 2022-06-24 14:28:21
    744
    0
  • 语音识别在汽车科技中的应用

    未来发展方向 自适应学习 引入自适应学习技术,使得语音指令识别模型能够根据驾驶员的口音和语速自动调整,提高在不同条件下的识别准确性。 语音情感识别语音指令中融入情感识别技术,使车辆能够理解驾驶员的情绪,提供更智能的互动体验。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:40:30
    3
    0
  • 语音识别在医疗领域的应用

    技术原理 语音识别技术 语音识别技术在医疗领域的应用主要通过将医生的口头输入转化为文字,实现病历记录自动化。深度学习模型,尤其是循环神经网络(RNN)和转录注意力模型(Transformer),在提高语音识别准确性方面取得显著成果。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:25:52
    1
    0
  • 语音识别】基于matlab隐马尔可夫模型(HMM)孤立字语音识别【含Matlab源码 576期】

    HMM)孤立字语音识别【含Matlab源码 576期】 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    作者: 海神之光
    发表时间: 2022-05-29 16:29:30
    418
    0
  • [python]基于faster whisper实时语音识别语音转文本

    faster whisper地址: https://github.com/SYSTRAN/faster-whisper 实现功能: 从麦克风获取声音进行实时语音识别转文本 代码仅仅用了40多行即可实现实时语音转文本功能 封装成类调用十分简单,代码如下:    

    作者: futureflsl
    发表时间: 2023-12-31 20:51:28
    2
    0
  • 聊聊语音识别技术前景

    语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。

    作者: QGS
    33
    1