已找到以下 10000 条记录
  • 定制语音识别的应用场景

    定制语音识别的应用场景应用场景详细描述语音客服质检识别客服、客户的语音,转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录。

    作者: 极客潇
    1647
    1
  • 开源语音识别引擎的比较与评估

    部署过程 克隆Kaldi仓库 git clone https://github.com/kaldi-asr/kaldi.git 安装依赖项 安装Kaldi的依赖项,如OpenFst、ATLAS等。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:31:26
    1
    0
  • 深度学习在语音识别方面的应用

    深度学习在语音识别中的应用 深度学习在语音识别中的应用非常广泛,包括语音识别、语音翻译和语音合成等。以下是深度学习在语音识别中的一些应用。 语音识别 语音识别是一种将语音信号转换为文本的技术。深度学习在语音识别中的应用非常广泛,可以实现高精度的语音识别

    作者: wljslmz
    发表时间: 2023-05-11 23:04:00
    18
    0
  • 深度学习在语音识别中的应用

    其通过引入门控结构,有效地捕捉长期依赖关系,成为语音识别中的重要算法。 应用场景 自动语音识别ASR) 深度学习在ASR领域广泛应用,取得了较传统方法更好的性能。大型语音数据集的训练和深度模型的使用使得ASR系统在多样性和复杂性上取得了显著的改进。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:19:48
    5
    0
  • 语音识别的隐私与安全问题

    引言 随着语音识别技术的迅猛发展,人们在日常生活中越来越多地使用语音助手、语音搜索等功能。然而,随之而来的是与语音识别相关的隐私与安全问题。本文将深入探讨语音识别领域的隐私和安全问题,分析具体案例,讨论解决方案,并展望未来发展趋势。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:42:02
    2
    0
  • 删除离线作业 - 推荐系统 RES

    图1 删除作业 离线作业删除后,将不可恢复,请谨慎操作。 父主题: 离线作业

  • IVR语音识别结果解析

    【问题来源】     内部测试环境功能测试 【问题简要】     ASR识别结果为:{<id 余额查询余额查询><asrid ef9ff17e749f45df><meaning 余额查询余额查询>}0.990     怎么获取到ASR识别结果中的业务名称“余额查询”,使用哪个CELL

    作者: yd_229588845
    173
    19
  • 语音识别端到端模型解读(一)

    FSMN及其变体模型 一、概述 在很长一段时间内,语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展,出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中,RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。

    作者: perlisp
    发表时间: 2020-12-01 16:49:03
    6520
    0
  • 深度学习在语音识别中的应用

    引言 语音识别技术是人工智能领域中的一个重要分支,它使得机器能够理解和转换人类的语音为文本。深度学习的出现极大地推动了语音识别技术的发展。本文将介绍如何使用深度学习构建一个基本的语音识别系统,并提供一个实践案例。

    作者: 是Dream呀
    发表时间: 2024-12-21 13:28:21
    239
    0
  • 语音识别】基于matlab GUI BP神经网络0到10数字语音识别【含Matlab源码 672期】

    一、BP神经网络语音识别简介 1 对语音的WAV文件和LAB文件进行处理,产生十个文件,每个文件对应于一个数字

    作者: 海神之光
    发表时间: 2022-05-28 18:44:38
    292
    0
  • 语音识别音频处理的交叉研究

    引言 语音识别音频处理是两个密切相关的领域,它们在语音技术、人机交互和音频应用等方面有着广泛的应用。本文将深入研究语音识别音频处理的交叉研究,探讨它们的技术原理、实际项目部署过程、示例应用,以及未来的发展方向。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:33:58
    4
    0
  • 语音识别与人工智能的融合

    语音识别模型训练 在模型训练阶段,我们使用深度学习模型,如LSTM,对预处理后的音频数据进行训练。训练的目标是使模型能够准确地将音频信号转化为对应的文本。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:24:35
    3
    0
  • 使用Python实现语音识别与处理模型

    计算准确率 accuracy = accuracy_score(y_test, y_pred) print("模型在测试集上的准确率:", accuracy) 在这个示例中,我们首先加载了预先录制的音频数据,并对每个音频文件进行MFCC特征提取。

    作者: Echo_Wish
    发表时间: 2024-04-23 09:02:56
    63
    0
  • 基于MindXSDK的中文语音识别推理实验

    实验介绍本实验将通过创建基于昇腾310处理器的推理环境,使用两个离线推理模型Conformer和Transformer模型,借助MindX SDK mxVision 将中文语音数据集识别成对应的文字,实现中文语音识别的功能。

    作者: 昇腾小AI
    160
    0
  • 语音识别在汽车科技中的应用

    数据准备与预处理 在语音识别项目中,首先需要收集包含车辆指令的语音数据。数据预处理包括音频格式转换、噪音去除等操作。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:40:30
    3
    0
  • 语音识别】基于matlab GUI HMM 0~9数字和汉字语音识别(带面板)【含Matlab源码 1716期】

    123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216 三、运行结果 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践

    作者: 海神之光
    发表时间: 2022-05-28 17:31:08
    348
    0
  • 浅聊语音识别技术常用的方法

    语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

    作者: QGS
    9
    1
  • 使用热词功能提升语音识别效果

    热词可在一句话识别、录音文件识别、实时语音识别使用。例如将地名和人名作为热词,则语音可以准确识别出人名和地名。

  • 语音识别】基于matlab GUI DTW MFCC 0-9数字语音识别(带面板)【含Matlab源码 385期】

    其特点为:①在结构上基本沿用语音识别的系统。②利用使用过程中的数据修正原模板,即当在某次使用过程 中某说话人被正确确认时使用此时的输人特征对原模板作加权修改(一般用1/10加权)。 这样可使模板逐次趋于完善。

    作者: 海神之光
    发表时间: 2022-05-28 20:10:56
    269
    0
  • 语音翻译_语音识别_语音合成

    【语音翻译 语音合成 语音识别 语音播报】语音翻译API用于识别短语音(60秒)并翻译为指定语言的文本,接口集成语音识别、文本翻译、语音合成技术能力,支持四十多种语音的语音识别和翻译,可将翻译结果转换为语音播报。 —— 我们只做精品!

    交付方式: API