内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

    一、获取代码方式 获取代码方式1: 完整代码已上传我的资源:【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    作者: 海神之光
    发表时间: 2022-05-28 15:01:45
    291
    0
  • SIS实时语音识别C++版SDK使用指南

    今天要介绍的主角是华为云SIS语音交互服务实时语音识别的C++版SDK(Linux版),接下来让我们一步步介绍该SDK的安装与使用 前期准备 该工程基于CMake实现,所需要的依赖仅包括g++和cmake。 g++版本建议4.8.5以上 cmake版本至少是3.14 CentOS系统

    作者: ASR-beginer
    发表时间: 2023-02-23 09:29:52
    3349
    0
  • 自动语音识别ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。 什么是自动语音识别ASR)? 自动语音识别(Automatic

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-16 18:34:56
    0
    0
  • 【入驻式求助】语音识别后调用动态库异常

    函数,日志显示能获取正常的语音识别结果,也能成功调用动态库的函数,结果正常。当我修改第 31 行为 <goto next="#test1"/>,即获取语音识别结果后去调用动态库的另一个函数 TISC_QueryKey,此时会出现获取不到语音识别结果,而且日志也卡死了,也没有看到任何

    作者: 凡小枫
    2754
    8
  • 【人工智能相关知识分享】语音识别的分类应用

    根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。 另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(

    作者: 某地瓜
    1655
    1
  • post/voiceRubbish/disti 根据语音识别 - API

    该API属于APIHub22579服务,描述: 通过上传的语音,识别语音内容,并检索垃圾分类信息。<a href="https://juhe.oss-cn-hangzhou.aliyuncs.com/api_sample_data/490/rubbish.pcm" target=

  • 语音识别出现识别结果非常差的情况解决思路

    调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同的采样率,播放正常的即为音频正常采样率。如果检查参数“property”是否与采样率一致

    作者: 极客潇
    1088
    2
  • 【人工智能相关知识分享】语音识别系统实现

    语音识别系统选择识别基元的要求是,有准确的定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。

    作者: 某地瓜
    2148
    1
  • 9600排队机,发起语音识别失败问题

    麻烦分析一下流程日志,具体是因为什么导致的语音识别失败

    作者: lmm
    1633
    7
  • 自动语音识别ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。 什么是自动语音识别ASR)? 自动语音识别(Automatic

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-25 23:43:30
    63
    0
  • OpenAI 开源多语言语音识别系统 Whisper

    OpenAI 开源了它的多语言语音识别系统 Whisper,源代码采用 MIT 许可证托管在 GitHub 上。语音识别系统是科技巨头软件和服务的核心部分,Whisper 能将多种语言的语音翻译到文本,并将其翻译到英语。它使用了 68 万小时的多语言语音数据进行训练,数据集是从网

    作者: 星恒
    54
    2
  • 自学记录HarmonyOS Next的HMS AI API 13:语音合成与语音识别

    console.info('语音识别服务初始化成功'); } catch (error) { console.error('语音识别服务初始化失败:', error); } } initializeSpeechRecognizer(); 实时语音识别 实现语音识别并动态监听结果: async

    作者: 李游Leo
    发表时间: 2024-12-28 19:43:08
    197
    0
  • 《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

    摘要我们介绍了使用神经模型的语音识别问题,强调了当输入和输出序列的长度不同时,训练和推理的CTC损失。我们讨论了在推理过程中使用的beam搜索,以及如何使用图Transformer网络(Graph Transformer Network)在训练时对该过程进行建模。图Transfo

    作者: 可爱又积极
    638
    1
  • 语音识别中的transformer(只用encoder)语言模型理解

    语音识别中的transformer(只用encoder)模型: RNN基础结构: 在RNN当中,tokens是一个一个被喂给模型的。比如在a3的位置,模型要等a1和a2的信息都处理完成后,才可以生成a3。 Attention: 如图,蓝色方框为一个attention模型。在每

    作者: 可爱又积极
    发表时间: 2022-03-04 07:22:35
    2827
    0
  • 关于《基于深度学习算法的语音识别》沙箱实验的建议

    问题描述: 实验中上传本地数据至自己创建的OBS过程非常费时,拷贝代码功能不太完善 建议方案: 感觉这个实验完全没有必要把训练用的数据,先从https://sandbox-experiment-resource-north-4.obs.cn-north-4.myhuaweicloud

    作者: 侠岚
    发表时间: 2021-12-27 10:47:02
    948
    0
  • 【Atlas】【中文语音识别】请问使用的wav文件有什么要求

    我已经复现了https://www.hiascend.com/zh/developer/mindx-sdk/applicationDetails/60172266?fromPage=3该案例,以及通过https://gitee.com/ascend/samples/tree/ma

    作者: 岁寒良木
    531
    1
  • 《攻克LSTM语音识别“语速关”:技术新突破与解决方案》

    层训练的方式可以让模型更稳定地学习不同语速下的语音识别任务。 - 多任务学习:将语速估计任务与语音识别任务结合起来,让LSTM模型同时学习预测语音的内容和语速。通过多任务学习,模型可以更好地理解语速与语音内容之间的关系,从而在语音识别中更好地适应不同语速。 - 调整训练参数:对学

    作者: 程序员阿伟
    发表时间: 2025-02-11 15:53:30
    0
    0
  • 语音识别现阶段都有哪些应用场景?

    语音识别已经成为人工智能应用的一个重点,通过语音控制设备简单方便,在各个领域兴起了研究应用的热潮。数据、算法及芯片是语音识别技术的3个关键,大量优质的数据、精准快速的算法和高性能语音识别芯片是提升语音识别的核心。语音是人工智能产品的主要入口,乃兵家必争之地也。    目前语音识别

    作者: 极客潇
    4030
    2
  • 【人工智能相关知识分享】语音识别的技术发展

    技术发展 目前在大词汇语音识别方面处于领先地位的IBM语音研究小组,就是在70年代开始了它的大词汇语音识别研究工作的。AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究历经10年,其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。 这一时期所取得的重大进展有:

    作者: 某地瓜
    2564
    1
  • 【入驻式求助】关于语音识别超时后自动挂断问题

    【问题简要】语音识别超时会挂断【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】科大那边做的语音识别,设置了识别时长为一分钟,实际测试发现,如果超过一分钟就会自动挂断,看日志流程也终止不走了,也没有拆线操作,日志如图,测试流程请看附件

    作者: yy2019
    3575
    5