搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

使用热词功能提升语音识别效果

使用热词功能提升语音识别效果前提条件确保已按照配置Python环境配置完毕，Python SDK仅支持Python3。初始化Client 初始化HotWordClient，详见表 HotWordClient初始化参数。

开发者 > 开发服务
语音识别中的语言模型：连接语音与文本

语音识别（Speech Recognition）技术使得计算机能够将语音信号转化为文本，是现代自然语言处理（NLP）领域的重要应用之一。语言模型在语音识别系统中扮演着关键角色，通过提高识别的准确性和流畅性，帮助将语音信号准确转化为文本。本文将详细探讨语音识别中的语言模型，包括技

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-08-10 12:51:30

107

0
DFCNN + Transformer模型完成中文语音识别（一）

Transformer模型完成中文语音识别语音识别，通常称为自动语音识别，（Automatic Speech Recognition，ASR），主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的文本内容，也有可能是二进制编码或者字符序列。但是，我们一般理解的语音识别其实都是狭义的语音转文字的过程，简称语音转文本识别（

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:37:26

559

0
端到端语音识别的发展趋势
端到端语音识别的发展趋势

log(1 + 10 * mel_spectrogram) 2. 端到端语音识别模型训练训练端到端语音识别模型需要使用带有文本标注的音频数据，常使用CTC作为损失函数。 # 代码示例 - 端到端语音识别模型训练 import tensorflow as tf from tensorflow

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:32:37

5

0
【语音识别】基于matlab GUI语音识别信号灯图像模拟控制（带面板）【含Matlab源码 757期】

因此，一个完整的基于统计的语音识别系统可大致分为以下步骤： (1)语音信号预处理： (2)语音信号特征提取； (3)声学模型选择； (4)模式匹配选择； (5)语言模型选择： (6)语言信息处理。语音识别研究的第一步为选择识别单元，常用的语音识别单元有单词(句)、音节和音素三

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 17:40:56

364

0
LF-MMI在语音识别中的应用
LF-MMI在语音识别中的应用

将表示为一个和语音识别解码时类似的语言模型G，并为MMI分母构建一个类似HCLG的解码图，则该解码图中组合了MMI中的声学模型和语言模型的信息。我们提到一定要是有限的，可枚举的，当MMI分母和语音识别解码图是一样时，即以词Word作为语言模型的单元，一般的语音识别系统词级别在数十

开发者 > 博客

作者：作家小然

发表时间： 2020-07-14 16:50:15

9661

1
ModelArts搭建中文语音识别系统【转载】

介绍的内容主要分为如下几个部分：语音识别技术概述DFCNN全序列卷积神经网络介绍Transformer原理使用ModelArts快速上手训练DFCNN+Transformer模型完成中文语音识别系统的搭建一、语音识别技术概述1.语音识别概述语音识别（SpeechRecogniti

开发者 > 其他

作者：浩泽学编程

683

4
多语言语音识别挑战与解决方案

**引言** 多语言语音识别是语音技术领域中的一个重要挑战。随着全球化的发展，不同语种之间的语音识别需求逐渐增加。本文将深入研究多语言语音识别所面临的挑战，并提出相应的解决方案。通过项目实例，我们将详细探讨挑战的性质以及采用的技术手段。 **项目介绍** 我们选择了一个涉及多国

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:27:58

1

0
【入驻式求助】语音识别问题
【入驻式求助】语音识别问题

被识别为用户静音【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】正常声音说话，对于短语音识别，如客户说【对】【是】等等一两个字时，有比较大的概率会被识别为静音异常为noinput，请问有什么方法可以优化一下吗

开发者 > 其他

作者： yy2019

2346

1
语音识别准确率不高，如何提高？

你好，我试用了一下语音识别的功能，发现语音识别准确率不高，如何提高呢？我的语音里有些专业词语识别得不好。还有，我想知道这个语音识别的功能支持区分角色嘛？

开发者 > 其他

作者：白马过平川

4260

2
新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

语音识别技术的发展已有数十年发展历史，大体来看可以分成传统的识别的方法和基于深度学习网络的端到端的方法。无论哪种方法，都会遵循“输入-编码-解码-输出”的过程。图1 语音识别过程编码过程：语音识别的输入是声音，属于计算机无法直接处理的信号，所以需要编码过程将其转变为数字信

开发者 > 博客

作者：黄辣鸡

发表时间： 2021-12-27 07:11:12

4152

0
语音识别系统的组成部分
语音识别系统的组成部分

语音识别系统的五个主要组成部分：前端声学处理(Preprocessing)前端声学处理是语音识别流程的第一步，它负责捕获和初步处理来自麦克风等传感器的原始语音信号。这部分通常包括以下几个子步骤：声音采集：收集环境中的语音信号。预加重：对语音信号进行预加重处理，以补偿高频信号在传输

开发者 > 其他

作者： DevFeng

32

1
语音识别端到端模型解读（一）

一、概述在很长一段时间内，语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展，出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中，RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。用得最多的RNN模型包括LSTM、GRU等。但RNN在每

开发者 > 其他

作者： void0

4805

2
在小藤上实现WeNet自动语音识别

代码仓地址：https://gitee.com/ascend/ascend_community_projects/tree/310B/SpeechRecognition 登录开发板： cd ${HOME}/ascend_community_projects/SpeechRecognition

开发者 > 博客

作者：张辉

发表时间： 2023-09-01 07:38:30

54

0
【语音识别】基于matlab男女声识别【含Matlab源码 452期】

（2）隐马尔可夫法(HMM) 隐马尔可夫法(HMM) 是70年代引入语音识别理论的，它的出现使得自然语音识别系统取得了实质性的突破。HMM 方法现已成为语音识别的主流技术，目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 19:33:32

345

0
kaldi语音识别 chain模型的数据准备

egs的可视化：在介绍chain模型的数据准备过程之前，我们先来看一下所生成egs的具体内容： nnet3-chain-copy-egs ark:train.cegs ark,t:text.cegs 通过以上指令可将chain模型生成的egs由二进制文件转化成文本文件。具体形式如下图所示：

开发者 > 博客

作者： ASR-beginer

发表时间： 2020-07-02 11:00:32

11793

0
kaldi语音识别 chain模型的训练流程

0.解析配置文件调用steps/nnet3/xconfig_to_configs.py函数生成final.config。如果配置文件中有指定affine-transform-file=$dir/configs/idct.mat。则也会在解析过程中生成该文件。生成idct.ma

开发者 > 博客

作者： ASR-beginer

发表时间： 2020-07-02 11:13:10

8475

1
Python智能语音识别语翻译平台｜项目后端搭建

shlib、pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。 Python程序设计基础，第三方库Django、requests、hashlib、pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-12-06 00:05:22

149

0
基于语音识别的人机交互设计
基于语音识别的人机交互设计

项目介绍基于语音识别的人机交互设计项目通常涉及两个主要方面：语音识别引擎的集成和相应应用的开发。首先，选择合适的语音识别引擎，然后设计并开发应用，实现用户通过语音与系统进行交互。技术原理语音识别引擎选择一款成熟的语音识别引擎是关键的一步。Google的Speech-to-Text

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:37:57

3

0
【云驻共创】华为云AI实战营：语音识别

音频分割同样是语音领域的基础任务，根据定义的一组特征将音频样本分割成段。目前音频分割的一个应用是心音分割，即识别心脏的特定信号，帮助诊断心血管疾病。音频指纹识别音频指纹识别的目的是从音频中提取一段特定的数字特征，用于快速识别该段音频是否来自音频样本，或从音频库中搜索出带有相同数字特征的音频。听歌识曲的功能就是使用最广泛的音频指纹识别应用。

开发者 > 博客

作者： Linux猿

发表时间： 2021-12-04 14:56:52

3296

0

总条数： 10000

上一页
1
...
5
6
7
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用热词功能提升语音识别效果

语音识别中的语言模型：连接语音与文本

DFCNN + Transformer模型完成中文语音识别（一）

端到端语音识别的发展趋势

【语音识别】基于matlab GUI语音识别信号灯图像模拟控制（带面板）【含Matlab源码 757期】

LF-MMI在语音识别中的应用

ModelArts搭建中文语音识别系统【转载】

多语言语音识别挑战与解决方案

【入驻式求助】语音识别问题

语音识别准确率不高，如何提高？

新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

语音识别系统的组成部分

语音识别端到端模型解读（一）

在小藤上实现WeNet自动语音识别

【语音识别】基于matlab男女声识别【含Matlab源码 452期】

kaldi语音识别 chain模型的数据准备

kaldi语音识别 chain模型的训练流程

Python智能语音识别语翻译平台｜项目后端搭建

基于语音识别的人机交互设计

【云驻共创】华为云AI实战营：语音识别

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线