内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习在语音识别中的应用

    其通过引入门控结构,有效地捕捉长期依赖关系,成为语音识别中的重要算法。 应用场景 自动语音识别ASR) 深度学习在ASR领域广泛应用,取得了较传统方法更好的性能。大型语音数据集的训练和深度模型的使用使得ASR系统在多样性和复杂性上取得了显著的改进。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:19:48
    5
    0
  • 语音识别的隐私与安全问题

    引言 随着语音识别技术的迅猛发展,人们在日常生活中越来越多地使用语音助手、语音搜索等功能。然而,随之而来的是与语音识别相关的隐私与安全问题。本文将深入探讨语音识别领域的隐私和安全问题,分析具体案例,讨论解决方案,并展望未来发展趋势。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:42:02
    2
    0
  • 深度学习在语音识别中的应用

    引言 语音识别技术是人工智能领域中的一个重要分支,它使得机器能够理解和转换人类的语音为文本。深度学习的出现极大地推动了语音识别技术的发展。本文将介绍如何使用深度学习构建一个基本的语音识别系统,并提供一个实践案例。

    作者: 是Dream呀
    发表时间: 2024-12-21 13:28:21
    239
    0
  • IVR语音识别结果解析

    【问题来源】     内部测试环境功能测试 【问题简要】     ASR识别结果为:{<id 余额查询余额查询><asrid ef9ff17e749f45df><meaning 余额查询余额查询>}0.990     怎么获取到ASR识别结果中的业务名称“余额查询”,使用哪个CELL

    作者: yd_229588845
    171
    19
  • 浅聊语音识别技术常用的方法

    语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

    作者: QGS
    9
    1
  • 语音识别端到端模型解读(一)

    FSMN及其变体模型 一、概述 在很长一段时间内,语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展,出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中,RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。

    作者: perlisp
    发表时间: 2020-12-01 16:49:03
    6520
    0
  • 使用热词功能提升语音识别效果

    热词可在一句话识别、录音文件识别、实时语音识别使用。例如将地名和人名作为热词,则语音可以准确识别出人名和地名。

  • 语音识别】基于matlab GUI DTW MFCC 0-9数字语音识别(带面板)【含Matlab源码 385期】

    其特点为:①在结构上基本沿用语音识别的系统。②利用使用过程中的数据修正原模板,即当在某次使用过程 中某说话人被正确确认时使用此时的输人特征对原模板作加权修改(一般用1/10加权)。 这样可使模板逐次趋于完善。

    作者: 海神之光
    发表时间: 2022-05-28 20:10:56
    269
    0
  • 语音识别】基于matlab GUI BP神经网络0到10数字语音识别【含Matlab源码 672期】

    一、BP神经网络语音识别简介 1 对语音的WAV文件和LAB文件进行处理,产生十个文件,每个文件对应于一个数字

    作者: 海神之光
    发表时间: 2022-05-28 18:44:38
    292
    0
  • 语音识别音频处理的交叉研究

    引言 语音识别音频处理是两个密切相关的领域,它们在语音技术、人机交互和音频应用等方面有着广泛的应用。本文将深入研究语音识别音频处理的交叉研究,探讨它们的技术原理、实际项目部署过程、示例应用,以及未来的发展方向。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:33:58
    4
    0
  • 语音识别与人工智能的融合

    语音识别模型训练 在模型训练阶段,我们使用深度学习模型,如LSTM,对预处理后的音频数据进行训练。训练的目标是使模型能够准确地将音频信号转化为对应的文本。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:24:35
    3
    0
  • 使用Python实现语音识别与处理模型

    计算准确率 accuracy = accuracy_score(y_test, y_pred) print("模型在测试集上的准确率:", accuracy) 在这个示例中,我们首先加载了预先录制的音频数据,并对每个音频文件进行MFCC特征提取。

    作者: Echo_Wish
    发表时间: 2024-04-23 09:02:56
    63
    0
  • 语音识别在汽车科技中的应用

    数据准备与预处理 在语音识别项目中,首先需要收集包含车辆指令的语音数据。数据预处理包括音频格式转换、噪音去除等操作。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:40:30
    3
    0
  • 语音识别】基于matlab GUI HMM 0~9数字和汉字语音识别(带面板)【含Matlab源码 1716期】

    123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216 三、运行结果 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践

    作者: 海神之光
    发表时间: 2022-05-28 17:31:08
    348
    0
  • 浅浅了解语音识别技术框架 

    汉语加上语气词共有412个音节,包括轻音字,共有1282个有调音节字,所以当在小词汇表孤立词语音识别时常选用词作为基元,在大词汇表语音识别时常采用音节或声韵母建模,而在连续语音识别时,由于协同发音的影响,常采用声韵母建模。 

    作者: QGS
    44
    1
  • 语音识别的主要步骤有哪些?

    声音的三个主要的主要属性,即音量(响度)、音调、音色(也称音品),声音的音量(volume),即音频的强度和幅度;声音的音调,也称为音高(pitch),即音频的频率或每秒变化的次数;声音的音色(timbre),即音频泛音或谐波成分。

    作者: 极客潇
    1290
    2
  • 语音识别的应用场景

    人机交互通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验。

    作者: 极客潇
    1555
    1
  • 语音识别 识别结果非常差 解决思路

    Ⅰ  调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。Ⅱ  解决方案如下Ⅲ  检查音频采样率是否符合。Ⅳ  对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同的采样率,播放正常的即为音频正常采样率。

    作者: 我就是豆豆
    460
    0
  • 端到端语音识别的发展趋势

    端到端语音识别模型训练 训练端到端语音识别模型需要使用带有文本标注的音频数据,常使用CTC作为损失函数。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:32:37
    5
    0
  • 语音识别在社交媒体分析中的应用

    get_social_media_audio(api_endpoint, audio_id): response = requests.get(api_endpoint + f"/audio/{audio_id}") audio_data = response.content # 转换音频格式

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:43:14
    3
    0