内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音识别 识别结果非常差 解决思路

    Ⅰ  调用语音识别接口,识别结果同真实结果差别很大,或者服务端报音频格式错误。Ⅱ  解决方案如下Ⅲ  检查音频采样率是否符合。Ⅳ  对于裸音频,可采用toolsoft Audio player等工具进行试听,通过设置不同采样率,播放正常即为音频正常采样率。Ⅴ  如果检查参数“

    作者: 我就是豆豆
    461
    0
  • 实时查询

    在左侧导航栏选择“监控>实时查询”,进入实时查询监控页面。在实时查询监控页面展示了当前运行在集群中所有查询和会话实时信息。 实时查询仅8.1.2及以上集群版本支持。 启动实时查询功能需要在“监控设置>监

  • DFCNN + Transformer模型完成中文语音识别(一)

    Transformer模型完成中文语音识别 语音识别,通常称为自动语音识别,(Automatic Speech Recognition,ASR),主要是将人类语音中词汇内容转换为计算机可读输入,一般都是可以理解文本内容,也有可能是二进制编码或者字符序列。但是,我们一般理解语音识别其实都是狭义语音转文字的过程,简称语音转文本识别(

    作者: HWCloudAI
    发表时间: 2022-12-19 03:37:26
    559
    0
  • [语音识别]用mindspore实现元音分类器尝试

    indspore实现语音识别。在官网教程上,看到有机器视觉(CV),也有自然语言处理(NLP),可是没有语音识别ASR),心中一直有个缺憾,想补齐这个能力。于是调研了其他框架入门例子,可以理解为机器视觉MNIST:1.Tensorflow语音识别教程,google

    作者: Daniel46010140
    1870
    1
  • ModelArts搭建中文语音识别系统【转载】

    识别和理解人类语音。除了传统语音识别技术之外,基于深度学习语音识别技术也逐渐发展起来。自动语音识别(Automatic Speech Recognition,ASR),也可以简称为语音识别。主要是将人类语音中词汇内容转换为计算机可读输入,一般都是可以理解文本内容,也有可

    作者: 浩泽学编程
    685
    4
  • 语音识别系统组成部分

    声学模型任务是在大量训练样本基础上学习各种语音特征与对应标签间概率分布规律。语言模型(Language Model)语言模型关注是语言语法和语义结构,目的是根据词汇间关联性和上下文信息评估一系列单词组成句子出现概率。语言模型可以基于规则编写,但更常见是采用统计

    作者: DevFeng
    32
    1
  • 噪声环境下语音识别挑战与解决方案

    引言 在现实生活中,语音识别系统经常面临噪声环境挑战,例如街头嘈杂声、办公室背景声等。这些噪声会降低语音识别系统性能,因此在噪声环境中实现准确语音识别是一个重要而具有挑战性任务。本文将深入研究噪声环境下语音识别挑战,并提出相应解决方案,结合实例进行详细讲解。 项目介绍

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:36:43
    0
    0
  • 【人工智能相关知识分享】语音识别的较新进展

    NN)后,语音识别错误率降低了30%,是近20年来语音识别技术方面最快进步。 2)目前大多主流语音识别解码器已经采用基于有限状态机(WFST)解码网络,该解码网络可以把语言模型、词典和声学共享音字集统一集成为一个大解码网络,大大提高了解码速度,为语音识别实时应用提供了基础。

    作者: 某地瓜
    4051
    3
  • 语音识别准确率不高,如何提高?

    你好,我试用了一下语音识别的功能,发现语音识别准确率不高,如何提高呢?我语音里有些专业词语识别得不好。还有,我想知道这个语音识别的功能支持区分角色嘛?

    作者: 白马过平川
    4260
    2
  • 语音识别端到端模型解读(一)

    一、概述在很长一段时间内,语音识别领域最常用模型是GMM-HMM。但近年来随着深度学习发展,出现了越来越多基于神经网络语音识别模型。在各种神经网络类型中,RNN因其能捕捉序列数据前后依赖信息而在声学模型中被广泛采用。用得最多RNN模型包括LSTM、GRU等。但RNN在每一个时刻计算都需

    作者: void0
    4805
    2
  • 【人工智能相关知识分享】语音识别的主要问题

    语音识别主要有以下五个问题: ⒈对自然语言识别和理解。首先必须将连续讲话分解为词、音素等单位,其次要建立一个理解语义规则。 ⒉语音信息量大。语音模式不仅对不同说话人不同,对同一说话人也是不同,例如,一个说话人在随意说话和认真说话时语音信息是不同。一个人说话方式随着时间变化。

    作者: 某地瓜
    1136
    2
  • 快来围观,语音识别都有哪些应用场景呢

    智能客服集成语音识别的智能客服系统,可以自动识别客户语音和语义,然后自动以语音形式回复客户。减少人力成本,保证服务质量。智能会议集成语音识别的智能会议系统,可以自动识别参会人员声纹、语音,通过实时、精准识别,达到实时弹幕显示、会议记录等。直播字幕在视频直播场景中,将音频实时转写成

    作者: 波妞
    9635
    3
  • 多语言语音识别挑战与解决方案

    **引言** 多语言语音识别是语音技术领域中一个重要挑战。随着全球化发展,不同语种之间语音识别需求逐渐增加。本文将深入研究多语言语音识别所面临挑战,并提出相应解决方案。通过项目实例,我们将详细探讨挑战性质以及采用技术手段。 **项目介绍** 我们选择了一个涉及多国语言语音识别

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:27:58
    1
    0
  • 【入驻式求助】语音识别问题

    别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】正常声音说话,对于短语音识别,如客户说【对】【是】等等一两个字时,有比较大概率会被识别为静音异常为noinput,请问有什么方法可以优化一下吗

    作者: yy2019
    2346
    1
  • 语音识别】基于matlab男女声识别【含Matlab源码 452期】

    音信号时间序列结构建立统计模型,将之看作一个数学上双重随机过程:一个是用具有有限状态数Markov 链来模拟语音信号统计特性变化隐含随机过程,另一个是与Markov 链每一个状态相关联观测序列随机过程。前者通过后者表现出来,但前者具体参数是不可测。人言语过程

    作者: 海神之光
    发表时间: 2022-05-28 19:33:32
    345
    0
  • Python智能语音识别语翻译平台|项目后端搭建

    pyttsx3等使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口传入。 Python程序设计基础,第三方库Django、requests、hashlib、pyttsx3等使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口传入。 01、任务实现步骤

    作者: TiAmoZhang
    发表时间: 2023-12-06 00:05:22
    149
    0
  • 基于MindXSDK中文语音识别推理实验

    随着科技发展让机器听懂人类语言已经成为现实这其中奥秘就是——语音识别技术 语音识别已渐渐融入到我们生活当中它让我们生活变得更便捷、更高效、也更智能本期趣味实验有关语音识别的基于MindX SDK中文语音识别推理实验 一起来看看吧!实验介绍本实验将通过创建基于昇腾310处

    作者: 昇腾小AI
    160
    0
  • 语音识别在金融行业应用案例

      return audio``` **2. 语音识别模型训练** 训练语音识别模型可以使用深度学习技术,如端到端语音识别模型。这需要大量标注好语音数据和对应文本标签。 ```python# 代码示例 - 端到端语音识别模型训练import tensorflow as tffrom

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:35:10
    1
    0
  • LF-MMI在语音识别应用

    networks for ASR based on lattice-free MMI中,发展为不使用LatticeMMI声学模型损失函数。在2018年多篇论文中,又应用在半监督声学模型训练中。本篇文章主要有两个目标:1. 推导MMI准则求导、梯度计算等,对于声学模型训练理论依据;2.

    作者: void0
    3590
    0
  • 学习笔记 - 语音识别之语音情感识别的大规模数据集

    最近看到一篇AI报道是有关通过夫妻几个月言语识别就能大致分辨出离婚征兆,那么业界目前在语音识别方向上新发展如何进行?具体到某一方面,如在语音识别方面如何去识别和分类情感,这篇论文《LSSED: a large-scale dataset and benchmark for speech

    作者: RabbitCloud
    1069
    3