搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

为什么语音识别 ASR服务端报SIS.0304？

问题现象客户端长时间没有发送语音，服务端超过20s没有收到语音，就会报这个错误，断开连接。解决方案1. 检查代码是否存在发送音频后是否睡眠过多时间。2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。

开发者 > 其他

作者：极客潇

952

3
人工智能：《基于深度学习算法的语音识别》-交流讨论帖

在实验手册指引下，您将体验到如何配置OBS，相关的ModelArts应用操作以及语音识别操作和语言模型操作。§ 您将掌握利用新型的人工智能（深度学习）算法，结合清华大学开源语音数据集THCHS30进行语音识别的实战演练，让使用者在了解语音识别基本的原理与实战的同时，更好的了解人工智能的相关内容与应

开发者 > 其他

作者：开发者学堂小助

5609

5
实时语音转写是什么？
实时语音转写是什么？

实时语音转写实时语音转写服务，用户通过实时访问和调用API获取实时语音转写结果。RASR优势识别准确率采用最新一代语音识别技术，基于DNN（深层神经网络）技术，大大提高了抗噪性能，使识别准确率显著提升。识别速度快把语言模型，词典和声学模型统一集成为一个大的神经网络，同时在工程上进

开发者 > 其他

作者：浅岛

431

1
《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

摘要我们介绍了使用神经模型的语音识别问题，强调了当输入和输出序列的长度不同时，训练和推理的CTC损失。我们讨论了在推理过程中使用的beam搜索，以及如何使用图Transformer网络（Graph Transformer Network）在训练时对该过程进行建模。图Transfo

开发者 > 其他

作者：可爱又积极

638

1
【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】获取代码方式2：通过订阅紫极神光博客付费专栏，凭支付凭证，私信博主，可获得此代码。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:01:45

291

0
AI语音识别-我给浏览器加了个语音搜索功能

1. 前言随着物联网的发展,语音识别技术受到越来越多的关注，语音识别技术正积极推动信息通信领域的革命,语音拨号,语音邮件,语音输入乃至语音操控等以语音识别为基础的人机交互日益普及.尽管生物识别方式不断增多,语音识别方式仍是主流方式.与其他生物识别技术相比,语音识别技术不仅具有非接触

开发者 > 其他

作者： DS小龙哥

39

4
【入驻式求助】语音识别后调用动态库异常

函数，日志显示能获取正常的语音识别结果，也能成功调用动态库的函数，结果正常。当我修改第 31 行为 <goto next="#test1"/>，即获取语音识别结果后去调用动态库的另一个函数 TISC_QueryKey，此时会出现获取不到语音识别结果，而且日志也卡死了，也没有看到任何

开发者 > 其他

作者：凡小枫

2754

8
分享用于端到端流式语音识别的单向LSTM模型结构分析

view0420推荐原因端到端ASR模型中，以往的语音识别模块结构变成了单一的神经网络，这要求模型能处理更长的上下文信息，目前，双向LSTM(BiLSTM)已经在这方面取得了相当好的效果，但是并不适合流式语音识别。作者以此为出发点，讨论了现在流行的几种单向LSTM网络模型以及基于

开发者 > 其他

作者：初学者7000

1576

1
post/voiceRubbish/disti 根据语音识别 - API

该API属于APIHub22579服务，描述: 通过上传的语音,识别语音内容,并检索垃圾分类信息。<a href="https://juhe.oss-cn-hangzhou.aliyuncs.com/api_sample_data/490/rubbish.pcm" target=

开发者 > 开发工具
语音识别现阶段都有哪些应用场景？

语音识别已经成为人工智能应用的一个重点，通过语音控制设备简单方便，在各个领域兴起了研究应用的热潮。数据、算法及芯片是语音识别技术的3个关键，大量优质的数据、精准快速的算法和高性能语音识别芯片是提升语音识别的核心。语音是人工智能产品的主要入口，乃兵家必争之地也。目前语音识别

开发者 > 其他

作者：极客潇

4030

2
AI语音识别-我给浏览器加了个语音搜索功能

1. 前言随着物联网的发展,语音识别技术受到越来越多的关注，语音识别技术正积极推动信息通信领域的革命,语音拨号,语音邮件,语音输入乃至语音操控等以语音识别为基础的人机交互日益普及.尽管生物识别方式不断增多,语音识别方式仍是主流方式.与其他生物识别技术相比,语音识别技术不仅具有非接触

开发者 > 其他

作者： DS小龙哥

69

3
语音识别出现识别结果非常差的情况解决思路

调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。如果检查参数“property”是否与采样率一致

开发者 > 其他

作者：极客潇

1088

2
查询会议实时信息
查询会议实时信息

Array of attendee objects 被邀请与会者信息，包括预约会议时邀请的与会者和会中主持人邀请的与会者，已经加入会议的和未加入会议的都返回。 participants

开发者 > 开发服务
9600排队机，发起语音识别失败问题

麻烦分析一下流程日志，具体是因为什么导致的语音识别失败

开发者 > 其他

作者： lmm

1633

7
语音识别中的transformer（只用encoder）语言模型理解

3.为什么要用多头注意力：举一个不一定妥帖的例子：当你浏览网页的时候，你可能在颜色方面更加关注深色的文字，而在字体方面会去注意大的、粗体的文字。这里的颜色和字体就是两个不同的表示子空间。同时关注颜色和字体，可以有效定位到网页中强调的内容。使用多头注意力，也就是综合利用各方面的信息/特征。

开发者 > 博客

作者：可爱又积极

发表时间： 2022-03-04 07:22:35

2827

0
实时语音转写是什么？
实时语音转写是什么？

实时语音转写实时语音转写服务，用户通过实时访问和调用API获取实时语音转写结果。RASR优势识别准确率采用最新一代语音识别技术，基于DNN（深层神经网络）技术，大大提高了抗噪性能，使识别准确率显著提升。识别速度快把语言模型，词典和声学模型统一集成为一个大的神经网络，同时在工程上进

开发者 > 其他

作者：极客潇

1139

1
自然语言处理与语音识别的交叉点：理论、实践与项目部署

交叉点的具体运作方式。项目介绍我们选择了一个语音助手项目作为例子，该项目旨在将语音输入转换为文本，并通过NLP技术理解用户的意图，最终执行相应的任务。这个项目涵盖了ASR和NLP的多个方面，展示了它们在语音交互系统中的协同作用。理论基础 ASR的理论基础 ASR的核心是

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:22:07

0

0
如何利用华为云语音识别服务实现语音交互应用【玩转华为云】

首先，我们导入所需的库，包括华为云的基本凭据类和语音识别的SDK。接着，我们配置华为云的API密钥和服务区域，并创建语音识别客户端。然后，我们读取要进行语音识别的音频文件。发起语音识别请求，包括设置音频数据、数据类型、编解码方式和采样率等参数。最后，我们查询语音识别的结果，并输出到控制台。

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-06 17:14:59

9

0
关于《基于深度学习算法的语音识别》沙箱实验的建议

问题描述：实验中上传本地数据至自己创建的OBS过程非常费时，拷贝代码功能不太完善建议方案：感觉这个实验完全没有必要把训练用的数据，先从https://sandbox-experiment-resource-north-4.obs.cn-north-4.myhuaweicloud

开发者 > 博客

作者：侠岚

发表时间： 2021-12-27 10:47:02

948

0
kaldi中文语音识别---multi_cn案例整理及模型对比

单音子模型假设，一个音素的实际发音，与其左右相邻或相近的因素（上下文音素）无关。但音素的实际发音有可能受到其相邻、相近音素的影响，也可能因为其在句子中出现的位置不同而发生改变，此时就需要引入上下文相关的声学模型，不仅要考虑中心音素本身，还要考虑该音素所在位置的上下文音素。三音子建模可以实现对音素上

开发者 > 其他

作者：可爱又积极

1600

2

总条数： 10000

上一页
1
...
9
10
11
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

为什么语音识别 ASR服务端报SIS.0304？

人工智能：《基于深度学习算法的语音识别》-交流讨论帖

实时语音转写是什么？

《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

AI语音识别-我给浏览器加了个语音搜索功能

【入驻式求助】语音识别后调用动态库异常

分享用于端到端流式语音识别的单向LSTM模型结构分析

post/voiceRubbish/disti 根据语音识别 - API

语音识别现阶段都有哪些应用场景？

AI语音识别-我给浏览器加了个语音搜索功能

语音识别出现识别结果非常差的情况解决思路

查询会议实时信息

9600排队机，发起语音识别失败问题

语音识别中的transformer（只用encoder）语言模型理解

实时语音转写是什么？

自然语言处理与语音识别的交叉点：理论、实践与项目部署

如何利用华为云语音识别服务实现语音交互应用【玩转华为云】

关于《基于深度学习算法的语音识别》沙箱实验的建议

kaldi中文语音识别---multi_cn案例整理及模型对比

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线