内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 为什么语音识别 ASR服务端报SIS.0304?

    问题现象客户端长时间没有发送语音,服务端超过20s没有收到语音,就会报这个错误,断开连接。解决方案1. 检查代码是否存在发送音频后是否睡眠过多时间。2. 检查是否发送end请求,是否关闭客户端。超过20s没有发送数据同时也没有断开连接,就会报该错误。在使用完毕后一定要记得断开与服务端连接。

    作者: 极客潇
    952
    3
  • 人工智能:《基于深度学习算法语音识别》-交流讨论帖

     在实验手册指引下,您将体验到如何配置OBS,相关ModelArts应用操作以及语音识别操作和语言模型操作。§   您将掌握       利用新型的人工智能(深度学习)算法,结合清华大学开源语音数据集THCHS30进行语音识别的实战演练,让使用者在了解语音识别基本原理与实战同时,更好了解人工智能相关内容与应

    作者: 开发者学堂小助
    5609
    5
  • 实时语音转写是什么?

    实时语音转写实时语音转写服务,用户通过实时访问和调用API获取实时语音转写结果。RASR优势识别准确率采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升。识别速度快把语言模型,词典和声学模型统一集成为一个大神经网络,同时在工程上进

    作者: 浅岛
    431
    1
  • 《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

    摘要我们介绍了使用神经模型语音识别问题,强调了当输入和输出序列长度不同时,训练和推理CTC损失。我们讨论了在推理过程中使用beam搜索,以及如何使用图Transformer网络(Graph Transformer Network)在训练时对该过程进行建模。图Transfo

    作者: 可爱又积极
    638
    1
  • 语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

    一、获取代码方式 获取代码方式1: 完整代码已上传我资源:【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    作者: 海神之光
    发表时间: 2022-05-28 15:01:45
    291
    0
  • AI语音识别-我给浏览器加了个语音搜索功能

    1. 前言随着物联网发展,语音识别技术受到越来越多关注,语音识别技术正积极推动信息通信领域革命,语音拨号,语音邮件,语音输入乃至语音操控等以语音识别为基础的人机交互日益普及.尽管生物识别方式不断增多,语音识别方式仍是主流方式.与其他生物识别技术相比,语音识别技术不仅具有非接触

    作者: DS小龙哥
    39
    4
  • 【入驻式求助】语音识别后调用动态库异常

    函数,日志显示能获取正常语音识别结果,也能成功调用动态库函数,结果正常。当我修改第 31 行为 <goto next="#test1"/>,即获取语音识别结果后去调用动态库另一个函数 TISC_QueryKey,此时会出现获取不到语音识别结果,而且日志也卡死了,也没有看到任何

    作者: 凡小枫
    2754
    8
  • 分享用于端到端流式语音识别的单向LSTM模型结构分析

    view0420推荐原因端到端ASR模型中,以往语音识别模块结构变成了单一神经网络,这要求模型能处理更长上下文信息,目前,双向LSTM(BiLSTM)已经在这方面取得了相当好效果,但是并不适合流式语音识别。作者以此为出发点,讨论了现在流行几种单向LSTM网络模型以及基于

    作者: 初学者7000
    1576
    1
  • post/voiceRubbish/disti 根据语音识别 - API

    该API属于APIHub22579服务,描述: 通过上传语音,识别语音内容,并检索垃圾分类信息。<a href="https://juhe.oss-cn-hangzhou.aliyuncs.com/api_sample_data/490/rubbish.pcm" target=

  • 语音识别现阶段都有哪些应用场景?

    语音识别已经成为人工智能应用一个重点,通过语音控制设备简单方便,在各个领域兴起了研究应用热潮。数据、算法及芯片是语音识别技术3个关键,大量优质数据、精准快速算法和高性能语音识别芯片是提升语音识别的核心。语音是人工智能产品主要入口,乃兵家必争之地也。    目前语音识别

    作者: 极客潇
    4030
    2
  • AI语音识别-我给浏览器加了个语音搜索功能

    1. 前言随着物联网发展,语音识别技术受到越来越多关注,语音识别技术正积极推动信息通信领域革命,语音拨号,语音邮件,语音输入乃至语音操控等以语音识别为基础的人机交互日益普及.尽管生物识别方式不断增多,语音识别方式仍是主流方式.与其他生物识别技术相比,语音识别技术不仅具有非接触

    作者: DS小龙哥
    69
    3
  • 语音识别出现识别结果非常差情况解决思路

    调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同采样率,播放正常即为音频正常采样率。如果检查参数“property”是否与采样率一致

    作者: 极客潇
    1088
    2
  • 查询会议实时信息

    Array of attendee objects 被邀请与会者信息,包括预约会议时邀请与会者和会中主持人邀请与会者,已经加入会议和未加入会议都返回。 participants

  • 9600排队机,发起语音识别失败问题

    麻烦分析一下流程日志,具体是因为什么导致语音识别失败

    作者: lmm
    1633
    7
  • 语音识别transformer(只用encoder)语言模型理解

    3.为什么要用多头注意力: 举一个不一定妥帖例子:当你浏览网页时候,你可能在颜色方面更加关注深色文字,而在字体方面会去注意大、粗体文字。这里颜色和字体就是两个不同表示子空间。同时关注颜色和字体,可以有效定位到网页中强调内容。使用多头注意力,也就是综合利用各方面的信息/特征。

    作者: 可爱又积极
    发表时间: 2022-03-04 07:22:35
    2827
    0
  • 实时语音转写是什么?

    实时语音转写实时语音转写服务,用户通过实时访问和调用API获取实时语音转写结果。RASR优势识别准确率采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升。识别速度快把语言模型,词典和声学模型统一集成为一个大神经网络,同时在工程上进

    作者: 极客潇
    1139
    1
  • 自然语言处理与语音识别的交叉点:理论、实践与项目部署

    交叉点具体运作方式。 项目介绍 我们选择了一个语音助手项目作为例子,该项目旨在将语音输入转换为文本,并通过NLP技术理解用户意图,最终执行相应任务。这个项目涵盖了ASR和NLP多个方面,展示了它们在语音交互系统中协同作用。 理论基础 ASR理论基础 ASR核心是

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:22:07
    0
    0
  • 如何利用华为云语音识别服务实现语音交互应用【玩转华为云】

    首先,我们导入所需库,包括华为云基本凭据类和语音识别的SDK。 接着,我们配置华为云API密钥和服务区域,并创建语音识别客户端。 然后,我们读取要进行语音识别音频文件。 发起语音识别请求,包括设置音频数据、数据类型、编解码方式和采样率等参数。 最后,我们查询语音识别的结果,并输出到控制台。

    作者: 皮牙子抓饭
    发表时间: 2023-06-06 17:14:59
    9
    0
  • 关于《基于深度学习算法语音识别》沙箱实验建议

    问题描述: 实验中上传本地数据至自己创建OBS过程非常费时,拷贝代码功能不太完善 建议方案: 感觉这个实验完全没有必要把训练用数据,先从https://sandbox-experiment-resource-north-4.obs.cn-north-4.myhuaweicloud

    作者: 侠岚
    发表时间: 2021-12-27 10:47:02
    948
    0
  • kaldi中文语音识别---multi_cn案例整理及模型对比

    单音子模型假设,一个音素实际发音,与其左右相邻或相近因素(上下文音素)无关。但音素实际发音有可能受到其相邻、相近音素影响,也可能因为其在句子中出现位置不同而发生改变,此时就需要引入上下文相关声学模型,不仅要考虑中心音素本身,还要考虑该音素所在位置上下文音素。三音子建模可以实现对音素上

    作者: 可爱又积极
    1600
    2