搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】获取代码方式2：通过订阅紫极神光博客付费专栏，凭支付凭证，私信博主，可获得此代码。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:01:45

291

0
SIS实时语音识别C++版SDK使用指南

今天要介绍的主角是华为云SIS语音交互服务实时语音识别的C++版SDK（Linux版），接下来让我们一步步介绍该SDK的安装与使用前期准备该工程基于CMake实现，所需要的依赖仅包括g++和cmake。 g++版本建议4.8.5以上 cmake版本至少是3.14 CentOS系统

开发者 > 博客

作者： ASR-beginer

发表时间： 2023-02-23 09:29:52

3349

0
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

近年来，语音技术在人工智能领域的发展极为迅速，语音识别（ASR）和文本转语音（TTS）作为两项重要的核心技术，被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题，共同助力于实现自然、流畅的人机对话。什么是自动语音识别（ASR）？自动语音识别（Automatic

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-16 18:34:56

0

0
【入驻式求助】语音识别后调用动态库异常

函数，日志显示能获取正常的语音识别结果，也能成功调用动态库的函数，结果正常。当我修改第 31 行为 <goto next="#test1"/>，即获取语音识别结果后去调用动态库的另一个函数 TISC_QueryKey，此时会出现获取不到语音识别结果，而且日志也卡死了，也没有看到任何

开发者 > 其他

作者：凡小枫

2754

8
【人工智能相关知识分享】语音识别的分类应用

根据针对的发音人，可以把语音识别技术分为特定人语音识别和非特定人语音识别，前者只能识别一个或几个人的语音，而后者则可以被任何人使用。显然，非特定人语音识别系统更符合实际需要，但它要比针对特定人的识别困难得多。另外，根据语音设备和通道，可以分为桌面（PC）语音识别、电话语音识别和嵌入式设备（

开发者 > 其他

作者：某地瓜

1655

1
post/voiceRubbish/disti 根据语音识别 - API

该API属于APIHub22579服务，描述: 通过上传的语音,识别语音内容,并检索垃圾分类信息。<a href="https://juhe.oss-cn-hangzhou.aliyuncs.com/api_sample_data/490/rubbish.pcm" target=

开发者 > 开发工具
语音识别出现识别结果非常差的情况解决思路

调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。解决方案检查音频采样率是否符合。对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。如果检查参数“property”是否与采样率一致

开发者 > 其他

作者：极客潇

1088

2
【人工智能相关知识分享】语音识别系统实现

语音识别系统选择识别基元的要求是，有准确的定义，能得到足够数据进行训练，具有一般性。英语通常采用上下文相关的音素建模，汉语的协同发音不如英语严重，可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力，会使得性能急剧下降。

开发者 > 其他

作者：某地瓜

2148

1
9600排队机，发起语音识别失败问题

麻烦分析一下流程日志，具体是因为什么导致的语音识别失败

开发者 > 其他

作者： lmm

1633

7
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

近年来，语音技术在人工智能领域的发展极为迅速，语音识别（ASR）和文本转语音（TTS）作为两项重要的核心技术，被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题，共同助力于实现自然、流畅的人机对话。什么是自动语音识别（ASR）？自动语音识别（Automatic

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-25 23:43:30

63

0
OpenAI 开源多语言语音识别系统 Whisper

OpenAI 开源了它的多语言语音识别系统 Whisper，源代码采用 MIT 许可证托管在 GitHub 上。语音识别系统是科技巨头软件和服务的核心部分，Whisper 能将多种语言的语音翻译到文本，并将其翻译到英语。它使用了 68 万小时的多语言语音数据进行训练，数据集是从网

开发者 > 其他

作者：星恒

54

2
自学记录HarmonyOS Next的HMS AI API 13：语音合成与语音识别

console.info('语音识别服务初始化成功'); } catch (error) { console.error('语音识别服务初始化失败:', error); } } initializeSpeechRecognizer(); 实时语音识别实现语音识别并动态监听结果： async

开发者 > 博客

作者：李游Leo

发表时间： 2024-12-28 19:43:08

197

0
《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

摘要我们介绍了使用神经模型的语音识别问题，强调了当输入和输出序列的长度不同时，训练和推理的CTC损失。我们讨论了在推理过程中使用的beam搜索，以及如何使用图Transformer网络（Graph Transformer Network）在训练时对该过程进行建模。图Transfo

开发者 > 其他

作者：可爱又积极

638

1
语音识别中的transformer（只用encoder）语言模型理解

语音识别中的transformer（只用encoder）模型： RNN基础结构：在RNN当中，tokens是一个一个被喂给模型的。比如在a3的位置，模型要等a1和a2的信息都处理完成后，才可以生成a3。 Attention: 如图，蓝色方框为一个attention模型。在每

开发者 > 博客

作者：可爱又积极

发表时间： 2022-03-04 07:22:35

2827

0
关于《基于深度学习算法的语音识别》沙箱实验的建议

问题描述：实验中上传本地数据至自己创建的OBS过程非常费时，拷贝代码功能不太完善建议方案：感觉这个实验完全没有必要把训练用的数据，先从https://sandbox-experiment-resource-north-4.obs.cn-north-4.myhuaweicloud

开发者 > 博客

作者：侠岚

发表时间： 2021-12-27 10:47:02

948

0
【Atlas】【中文语音识别】请问使用的wav文件有什么要求

我已经复现了https://www.hiascend.com/zh/developer/mindx-sdk/applicationDetails/60172266?fromPage=3该案例，以及通过https://gitee.com/ascend/samples/tree/ma

开发者 > 其他

作者：岁寒良木

531

1
《攻克LSTM语音识别“语速关”：技术新突破与解决方案》

层训练的方式可以让模型更稳定地学习不同语速下的语音识别任务。 - 多任务学习：将语速估计任务与语音识别任务结合起来，让LSTM模型同时学习预测语音的内容和语速。通过多任务学习，模型可以更好地理解语速与语音内容之间的关系，从而在语音识别中更好地适应不同语速。 - 调整训练参数：对学

开发者 > 博客

作者：程序员阿伟

发表时间： 2025-02-11 15:53:30

0

0
语音识别现阶段都有哪些应用场景？

语音识别已经成为人工智能应用的一个重点，通过语音控制设备简单方便，在各个领域兴起了研究应用的热潮。数据、算法及芯片是语音识别技术的3个关键，大量优质的数据、精准快速的算法和高性能语音识别芯片是提升语音识别的核心。语音是人工智能产品的主要入口，乃兵家必争之地也。目前语音识别

开发者 > 其他

作者：极客潇

4030

2
【人工智能相关知识分享】语音识别的技术发展

技术发展目前在大词汇语音识别方面处于领先地位的IBM语音研究小组，就是在70年代开始了它的大词汇语音识别研究工作的。AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究历经10年，其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。这一时期所取得的重大进展有：

开发者 > 其他

作者：某地瓜

2564

1
【入驻式求助】关于语音识别超时后自动挂断问题

【问题简要】语音识别超时会挂断【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】科大那边做的语音识别，设置了识别时长为一分钟，实际测试发现，如果超过一分钟就会自动挂断，看日志流程也终止不走了，也没有拆线操作，日志如图，测试流程请看附件

开发者 > 其他

作者： yy2019

3575

5

总条数： 10000

上一页
1
...
8
9
10
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

SIS实时语音识别C++版SDK使用指南

自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

【入驻式求助】语音识别后调用动态库异常

【人工智能相关知识分享】语音识别的分类应用

post/voiceRubbish/disti 根据语音识别 - API

语音识别出现识别结果非常差的情况解决思路

【人工智能相关知识分享】语音识别系统实现

9600排队机，发起语音识别失败问题

自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

OpenAI 开源多语言语音识别系统 Whisper

自学记录HarmonyOS Next的HMS AI API 13：语音合成与语音识别

《图Transformer网络与语音识别》Facebook语音大牛Awni Hannun

语音识别中的transformer（只用encoder）语言模型理解

关于《基于深度学习算法的语音识别》沙箱实验的建议

【Atlas】【中文语音识别】请问使用的wav文件有什么要求

《攻克LSTM语音识别“语速关”：技术新突破与解决方案》

语音识别现阶段都有哪些应用场景？

【人工智能相关知识分享】语音识别的技术发展

【入驻式求助】关于语音识别超时后自动挂断问题

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线