搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

【云驻共创】华为云AI实战营：语音识别

1.2  语音识别知识介绍语音识别技术，也可以称为自动语音识别（Automatic Speech Recognition，ASR），其任务是将人说话的语音信号转换为可被计算机程序所识别的信息，从而识别说话人的语音指令及文字内容的技。

开发者 > 博客

作者： Linux猿

发表时间： 2021-12-04 14:56:52

3296

0
【问答官】ModelArts的语音识别技术优势在哪里？

【问答官】ModelArts的语音识别技术优势在哪里？

开发者 > 其他

作者： zhengy1347049

1149

4
天天用，但你未必了解语音识别技术

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，（ASR），其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。

开发者 > 其他

作者：加油O幸福

621

2
快来围观，语音识别都有哪些应用场景呢

直播字幕在视频直播场景中，将音频实时转写成文本字幕，与视频一起播出，提升观众友好性。结合敏感关键词检测服务，进行质检审查。人机交互通过语音唤醒、语音识别服务，对终端设备发送语音命令，对设备进行实时操作，提升人机交互体验。

开发者 > 其他

作者：波妞

9635

3
MRCP协议-提供语音识别（ASR）与语音合成服务（TTS）

例如，MRCP客户端向服务端请求想要发送一些音频数据以进行处理(比如说语音识别)，为此，服务端可以发送一个包含端口号的响应，因为MRCP并未定义音频数据的传输，所以，必须依靠其它的协议，比如说RTP来进行。　　

开发者 > 博客

作者：隔壁老汪

发表时间： 2022-06-24 14:28:21

744

0
AI学习记（语音识别）-第二集
AI学习记（语音识别）-第二集

语音识别发展历程如下：

开发者 > 其他

作者： @Wu

1851

4
微认证之路 AI智能语音识别计算器

常见的音频格式：MP3 WAV APE flac 7. 波形图，语谱图 8. 语音识别技术 1. 综合性的技术，它涉及到多个学科领域，如发声机理和听觉机理、信号处理、概率论和信息论、模式识别以及人工智能等等 9. 鸡尾酒会问题 1.

开发者 > 其他

作者：千江有水千江月

1964

0
【人工智能相关知识分享】语音识别声学模型

语音识别中使用HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模，一个音素就是一个三至五状态的HMM，一个词就是构成词的多个音素的HMM串行起来构成的HMM，而连续语音识别的整个模型就是词和静音组合起来的HMM。

开发者 > 其他

作者：某地瓜

1961

1
【物联网知识竞赛】+LD3320语音识别模块

LD3320语音识别模块通过哪些信号线通信？支持多少个识别条目？

开发者 > 其他

作者： sm15722473365

2547

1
人工智能趋势：语音识别发展前景广阔

2、语音识别领域将快速实现商业化部署通过利用机器学习技术进行自然语言的的深度理解，一直是工业和学术界关注的焦点。在人工智能的各项领域中，自然语言处理是最为成熟的技术，由此引来各大企业纷纷进军布局。

开发者 > 其他

作者：运气男孩

1266

4
Linux 中的机器学习：Whisper——自动语音识别系统

Whisper 是一种自动语音识别 (ASR) 系统，使用从网络收集的 680000 小时多语言和多任务数据进行训练，Whisper 由深度学习和神经网络提供支持，是一种基于 PyTorch 构建的自然语言处理系统，这是免费的开源软件。

开发者 > 博客

作者： wljslmz

发表时间： 2023-03-14 15:45:25

940

0
AI智能语音识别计算器
AI智能语音识别计算器

对语音识别和语音合成技术感兴趣的人结合语音识别和语音合成的原理，通过华为云SIS服务实现自己的语音交互小程序提升Python程序设计能力，语音处理基础能力使用语音交互服务实现AI小程序，提升自身编码能力和增加对语音识别及语音合成的理解智能语音计算实践语音处理技术概述语音识别和语音合成

开发者 > 开发者学堂
为什么语音识别 ASR服务端报SIS.0304？

检查代码是否存在发送音频后是否睡眠过多时间。2. 检查是否发送end请求，是否关闭客户端。超过20s没有发送数据同时也没有断开连接，就会报该错误。在使用完毕后一定要记得断开与服务端连接。

开发者 > 其他

作者：极客潇

952

3
基于深度学习的语音识别（Deep Learning-based Speech Recognition）

最后，使用pyaudio库加载了一个测试音频文件，读取了5秒钟的音频数据，提取了MFCC特征，并对其进行了预测，输出了预测结果。四、结论基于深度学习的语音识别技术是人工智能领域的一个重要应用，其未来发展前景广阔。然而，仍需要面对数据隐私保护、深度学习模型优化等挑战。

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-09-27 09:37:57

95

1
【语音识别】基于matlab GUI声纹识别【含Matlab源码 1022期】

人耳的声音频率感知范围在频谱上的不遵循线性关系，而是在Mel频域上遵循近似线性关系。梅尔频率倒谱系数考虑到了人类的听觉特征，先将线性频谱映射到基于听觉感知的Mel非线性频谱中，然后转换到倒谱上。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 19:07:39

303

0
SIS实时语音识别C++版SDK使用指南

今天要介绍的主角是华为云SIS语音交互服务实时语音识别的C++版SDK（Linux版），接下来让我们一步步介绍该SDK的安装与使用前期准备该工程基于CMake实现，所需要的依赖仅包括g++和cmake。

开发者 > 博客

作者： ASR-beginer

发表时间： 2023-02-23 09:29:52

3349

0
实时语音识别，如何在网页上使用websocket调用？

你好，我最近在试用华为云的实时语音识别功能，请问如何在网页上使用websocket调用呢？

开发者 > 其他

作者： Jaygu

3399

1
【NLP】自然语言处理学习笔记（一）语音识别

除了提升效率之外，更主要的是语音识别的场景中，翻译的第一个字的语义可能并不是第一个声音产生的，比如英文和中文的语序不一样。使用注意力就可以解决这个问题。 Spell 有了c向量之后，下面就可以进入到解码环节。

开发者 > 博客

作者： zstar

发表时间： 2022-08-05 18:07:13

233

0
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

什么是自动语音识别（ASR）？自动语音识别（Automatic Speech Recognition，简称 ASR）是一种将人类语音转换为文本的技术。其目标是让计算机“听懂”人类的语言，将语音信息准确地转化为文字输出。

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-16 18:34:56

0

0
【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

一、获取代码方式获取代码方式1：完整代码已上传我的资源：【语音识别】基于matlab说话人识别系统【

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:01:45

291

0

总条数： 10000

上一页
1
...
7
8
9
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

【云驻共创】华为云AI实战营：语音识别

【问答官】ModelArts的语音识别技术优势在哪里？

天天用，但你未必了解语音识别技术

快来围观，语音识别都有哪些应用场景呢

MRCP协议-提供语音识别（ASR）与语音合成服务（TTS）

AI学习记（语音识别）-第二集

微认证之路 AI智能语音识别计算器

【人工智能相关知识分享】语音识别声学模型

【物联网知识竞赛】+LD3320语音识别模块

人工智能趋势：语音识别发展前景广阔

Linux 中的机器学习：Whisper——自动语音识别系统

AI智能语音识别计算器

为什么语音识别 ASR服务端报SIS.0304？

基于深度学习的语音识别（Deep Learning-based Speech Recognition）

【语音识别】基于matlab GUI声纹识别【含Matlab源码 1022期】

SIS实时语音识别C++版SDK使用指南

实时语音识别，如何在网页上使用websocket调用？

【NLP】自然语言处理学习笔记（一）语音识别

自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

【语音识别】基于matlab说话人识别系统【含Matlab源码 1704期】

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线