搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

语音识别识别结果非常差解决思路

Ⅰ　　调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。Ⅱ　　解决方案如下Ⅲ　　检查音频采样率是否符合。Ⅳ　　对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。Ⅴ　　如果检查参数“

开发者 > 其他

作者：我就是豆豆

461

0
实时查询
实时查询

在左侧导航栏选择“监控>实时查询”，进入实时查询监控页面。在实时查询监控页面展示了当前运行在集群中的所有查询和会话的实时信息。实时查询仅8.1.2及以上集群版本支持。启动实时查询功能需要在“监控设置>监

开发者 > 开发服务
DFCNN + Transformer模型完成中文语音识别（一）

Transformer模型完成中文语音识别语音识别，通常称为自动语音识别，（Automatic Speech Recognition，ASR），主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的文本内容，也有可能是二进制编码或者字符序列。但是，我们一般理解的语音识别其实都是狭义的语音转文字的过程，简称语音转文本识别（

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:37:26

559

0
[语音识别]用mindspore实现元音分类器的尝试

indspore实现语音识别。在官网的教程上，看到有机器视觉的（CV），也有自然语言处理的(NLP)，可是没有语音识别（ASR），心中一直有个缺憾，想补齐这个能力。于是调研了其他的框架的入门例子，可以理解为机器视觉的MNIST：1.Tensorflow的语音识别教程，google

开发者 > 其他

作者： Daniel46010140

1870

1
ModelArts搭建中文语音识别系统【转载】

识别和理解人类的语音。除了传统语音识别技术之外，基于深度学习的语音识别技术也逐渐发展起来。自动语音识别（Automatic Speech Recognition，ASR），也可以简称为语音识别。主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的文本内容，也有可

开发者 > 其他

作者：浩泽学编程

685

4
语音识别系统的组成部分
语音识别系统的组成部分

声学模型的任务是在大量训练样本的基础上学习各种语音特征与对应标签间的概率分布规律。语言模型(Language Model)语言模型关注的是语言的语法和语义结构，目的是根据词汇间的关联性和上下文信息评估一系列单词组成的句子出现的概率。语言模型可以基于规则编写，但更常见的是采用统计

开发者 > 其他

作者： DevFeng

32

1
噪声环境下的语音识别挑战与解决方案

引言在现实生活中，语音识别系统经常面临噪声环境的挑战，例如街头嘈杂声、办公室背景声等。这些噪声会降低语音识别系统的性能，因此在噪声环境中实现准确的语音识别是一个重要而具有挑战性的任务。本文将深入研究噪声环境下的语音识别挑战，并提出相应的解决方案，结合实例进行详细讲解。项目介绍

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:36:43

0

0
【人工智能相关知识分享】语音识别的较新进展

NN）后，语音识别错误率降低了30%，是近20年来语音识别技术方面最快的进步。 2）目前大多主流的语音识别解码器已经采用基于有限状态机（WFST）的解码网络，该解码网络可以把语言模型、词典和声学共享音字集统一集成为一个大的解码网络，大大提高了解码的速度，为语音识别的实时应用提供了基础。

开发者 > 其他

作者：某地瓜

4051

3
语音识别准确率不高，如何提高？

你好，我试用了一下语音识别的功能，发现语音识别准确率不高，如何提高呢？我的语音里有些专业词语识别得不好。还有，我想知道这个语音识别的功能支持区分角色嘛？

开发者 > 其他

作者：白马过平川

4260

2
语音识别端到端模型解读（一）

一、概述在很长一段时间内，语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展，出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中，RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。用得最多的RNN模型包括LSTM、GRU等。但RNN在每一个时刻的计算都需

开发者 > 其他

作者： void0

4805

2
【人工智能相关知识分享】语音识别的主要问题

语音识别主要有以下五个问题： ⒈对自然语言的识别和理解。首先必须将连续的讲话分解为词、音素等单位，其次要建立一个理解语义的规则。 ⒉语音信息量大。语音模式不仅对不同的说话人不同，对同一说话人也是不同的，例如，一个说话人在随意说话和认真说话时的语音信息是不同的。一个人的说话方式随着时间变化。

开发者 > 其他

作者：某地瓜

1136

2
快来围观，语音识别都有哪些应用场景呢

智能客服集成语音识别的智能客服系统，可以自动识别客户的语音和语义，然后自动以语音形式回复客户。减少人力成本，保证服务质量。智能会议集成语音识别的智能会议系统，可以自动识别参会人员的声纹、语音，通过实时、精准的识别，达到实时弹幕显示、会议记录等。直播字幕在视频直播场景中，将音频实时转写成

开发者 > 其他

作者：波妞

9635

3
多语言语音识别挑战与解决方案

**引言** 多语言语音识别是语音技术领域中的一个重要挑战。随着全球化的发展，不同语种之间的语音识别需求逐渐增加。本文将深入研究多语言语音识别所面临的挑战，并提出相应的解决方案。通过项目实例，我们将详细探讨挑战的性质以及采用的技术手段。 **项目介绍** 我们选择了一个涉及多国语言的语音识别

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:27:58

1

0
【入驻式求助】语音识别问题
【入驻式求助】语音识别问题

别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】正常声音说话，对于短语音识别，如客户说【对】【是】等等一两个字时，有比较大的概率会被识别为静音异常为noinput，请问有什么方法可以优化一下吗

开发者 > 其他

作者： yy2019

2346

1
【语音识别】基于matlab男女声识别【含Matlab源码 452期】

音信号的时间序列结构建立统计模型，将之看作一个数学上的双重随机过程：一个是用具有有限状态数的Markov 链来模拟语音信号统计特性变化的隐含的随机过程，另一个是与Markov 链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来，但前者的具体参数是不可测的。人的言语过程

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 19:33:32

345

0
Python智能语音识别语翻译平台｜项目后端搭建

pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。 Python程序设计基础，第三方库Django、requests、hashlib、pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。 01、任务实现步骤

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-12-06 00:05:22

149

0
基于MindXSDK的中文语音识别推理实验

随着科技的发展让机器听懂人类语言已经成为现实这其中的奥秘就是——语音识别技术语音识别已渐渐融入到我们的生活当中它让我们的生活变得更便捷、更高效、也更智能本期趣味实验有关语音识别的基于MindX SDK的中文语音识别推理实验一起来看看吧！实验介绍本实验将通过创建基于昇腾310处

开发者 > 其他

作者：昇腾小AI

160

0
语音识别在金融行业的应用案例

  return audio``` **2. 语音识别模型训练** 训练语音识别模型可以使用深度学习技术，如端到端的语音识别模型。这需要大量标注好的语音数据和对应的文本标签。 ```python# 代码示例 - 端到端语音识别模型训练import tensorflow as tffrom

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:35:10

1

0
LF-MMI在语音识别中的应用
LF-MMI在语音识别中的应用

networks for ASR based on lattice-free MMI中，发展为不使用Lattice的MMI声学模型损失函数。在2018年的多篇论文中，又应用在半监督的声学模型训练中。本篇文章主要有两个目标：1. 推导MMI准则求导、梯度计算等，对于声学模型训练的理论依据；2.

开发者 > 其他

作者： void0

3590

0
学习笔记 - 语音识别之语音情感识别的大规模数据集

最近看到一篇AI报道是有关通过夫妻几个月的言语识别就能大致分辨出离婚的征兆，那么业界目前在语音识别方向上新的发展如何进行？具体到某一方面，如在语音识别方面如何去识别和分类情感，这篇论文《LSSED: a large-scale dataset and benchmark for speech

开发者 > 其他

作者： RabbitCloud

1069

3

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音识别识别结果非常差解决思路

实时查询

DFCNN + Transformer模型完成中文语音识别（一）

[语音识别]用mindspore实现元音分类器的尝试

ModelArts搭建中文语音识别系统【转载】

语音识别系统的组成部分

噪声环境下的语音识别挑战与解决方案

【人工智能相关知识分享】语音识别的较新进展

语音识别准确率不高，如何提高？

语音识别端到端模型解读（一）

【人工智能相关知识分享】语音识别的主要问题

快来围观，语音识别都有哪些应用场景呢

多语言语音识别挑战与解决方案

【入驻式求助】语音识别问题

【语音识别】基于matlab男女声识别【含Matlab源码 452期】

Python智能语音识别语翻译平台｜项目后端搭建

基于MindXSDK的中文语音识别推理实验

语音识别在金融行业的应用案例

LF-MMI在语音识别中的应用

学习笔记 - 语音识别之语音情感识别的大规模数据集

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线