内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音识别未来

    N-gram、word2vec等语音识别难点远场麦克风识别高噪音场景语音识别多人语音识别交谈背景语音识别非标准语音识别(变速,带有情绪等)未来展望更优算法与模型更先进麦克风阵列技术更先进声学模型与范式更强有力工具更深入特征方法和预处理方法多学科融合

    作者: G-washington
    1293
    1
  • 浅谈语音识别

    典+语音模型构建搜索空间,找到最合适路径。解码完成后最终输出文本。语音识别系统组成一个完整语音识别系统包括:预处理、特征提取、声学模型训练、语言模型训练语音解码器。预处理对输入原始声音信号进行处理,过滤掉其中背景噪音、非重要信息,还要对找到语音信号开始和结束、语音分

    作者: QGS
    48
    1
  • 端到端语音识别的发展趋势

    实时性能提升 随着硬件技术发展,端到端语音识别系统将更加注重实时性能,以满足实时交互和边缘计算需求。 结论 端到端语音识别技术发展为语音处理领域带来了新机遇和挑战。通过深度学习方法,端到端语音识别系统在语音转写、语音搜索等应用中取得了显著成就。未来,随着技术

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:32:37
    5
    0
  • kaldi语音识别

    kaldi语音识别 chain模型数据准备https://bbs.huaweicloud.com/blogs/180841kaldi语音识别 chain模型训练流程https://bbs.huaweicloud.com/blogs/180842

    作者: void0
    2819
    0
  • 语音识别的隐私与安全问题

    引言 随着语音识别技术迅猛发展,人们在日常生活中越来越多地使用语音助手、语音搜索等功能。然而,随之而来是与语音识别相关隐私与安全问题。本文将深入探讨语音识别领域隐私和安全问题,分析具体案例,讨论解决方案,并展望未来发展趋势。 项目介绍 语音识别技术在多个领域得到了广泛应用

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:42:02
    2
    0
  • 语音识别】基于matlab GUI HMM中文语音识别【含Matlab源码 1385期】

    隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。具体形式如下,这里设Q是所有可能状态集合,V是所有可能观测集合,即有: 3 前向算法 对于步骤一初始,是初始时刻状态i1 = q1和观测o1联合概率。步骤(2) 是前向概率递推公式,计算到时刻t+1部分观测序列为o1

    作者: 海神之光
    发表时间: 2022-05-28 16:47:25
    363
    0
  • ASR项目实战-语音识别

    小写等特性实现,满足字幕相关业务交付。 基于Kaldi实现语音识别引擎,声学模型+发音词典+语言模型,实现思路如下:将语音数据送入识别引擎,引擎除输出识别得到文本,同时可以得到音素列表,以及各音素在音频数据中出现时间偏移量,此时结合文字或者单词和音素之间映射关系,即

    作者: JackieAtHome
    发表时间: 2021-02-11 06:34:36
    3054
    0
  • 语音识别与语音控制

    source /opt/tros/setup.bash # 从tros.b安装路径中拷贝出运行示例需要配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载音频驱动,设备启动之后只需要加载一次 bash config/audio.sh

    作者: 梦笔生花
    发表时间: 2024-10-16 22:01:04
    111
    0
  • daka语音识别

    作者: 宝哥哥
    824
    3
  • 语音识别的主要步骤有哪些?

    几个步骤。声音三个主要主要属性,即音量(响度)、音调、音色(也称音品),声音音量(volume),即音频强度和幅度;声音音调,也称为音高(pitch),即音频频率或每秒变化次数;声音音色(timbre),即音频泛音或谐波成分。每个人发音都有其独特音品,为此,在

    作者: 极客潇
    1288
    2
  • 什么是定制语音识别

    定制语音识别定制语音识别提供了一句话识别,录音文件识别功能。一句话识别对时长较短语音识别速度更快,录音文件识别对时长较长录音文件识别。一句话识别:可以实现1分钟以内音频到文字转换。对于用户上传二进制数据,系统经过处理,生成语音对应文字,支持热词定制。录音文件识别:对于录制

    作者: 极客潇
    1345
    1
  • 语音和语音识别介绍

    最简单应用如:区分不同动物叫声;区分男性和女性声音 复杂一些应用有:音乐曲风分类 音频分类可以包含多个类别,一个音频可以同时属于不同类,也就是有多个标签。 音频分割 音频分割同样是语音领域基础任务,根据定义一组特征将音频样本分割成段。 音频分割是一个重要预处理步

    作者: HWCloudAI
    发表时间: 2022-12-12 07:46:32
    373
    0
  • 【hilens】【语音识别功能】语音识别播放出来杂音

    tobytes())     wav.close() # 当前目录生成test.wav音频文件,可用常见播放器打开用上述代码保存wav格式音频文件,在windows上播放时没有目标声音都是很大杂音?是怎么回事?并且日志里面显示如下信息:chmod: cannot access '/dev/video*':

    作者: 五五啊
    1241
    3
  • 语音识别】基于matlab VQ特定人孤立词语音识别【含Matlab源码 536期】

    目前自动说话人识别的方法主要是基于参数模型HMM方法和基于非参数模型VQ方法。1992年, 日本人Matsui和Fur ui主要从对语声波动鲁棒性方面对基于VQ方法和各态历经离散和连续HMM方法进行了比较。他们发现连续各态历经HMM方法比离散各态历经HMM方法优越, 当可用于训练数据量较小时,

    作者: 海神之光
    发表时间: 2022-05-28 20:01:16
    292
    0
  • 语音识别SDK

    语音识别有pythonSDK吗

    作者: ice_lut
    4579
    1
  • 语音识别 - 主要步骤

     声音三个主要主要属性,即音量(响度)、音调、音色(也称音品)。    声音音量(volume),即音频强度和幅度;    声音音调,也称为音高(pitch),即音频频率或每秒变化次数;    声音音色(timbre),即音频泛音或谐波成分。音品  每个人发音都

    作者: 学习怪
    641
    3
  • 定制语音识别和短语音识别服务区别

    发现语音识别服务中有一个定制语音识别,其实这个功能和短语音识别功能类似。对于没有定制需求用户,直接使用定制语音识别的接口即可,与语短音识别接口差别不大。定制语音识别服务支持热词,接受垂直领域模型、特殊方案定制需求。 定制需要收取一定定制费,定制流程以及费用。

    作者: 极客潇
    963
    1
  • 浅谈ASR语音识别

    语音识别(Automatic Speech Recognition,ASR)是一种将人类语音信号转换为文本或命令技术。其基础原理涉及到声学特征提取、声学模型建立和语言模型应用。以下是ASR基础原理:1. 声学特征提取ASR第一步是从语音信号中提取特征,这通常涉及以下几种技术:短时能量和短时过零率:

    作者: 运气男孩
    20
    1
  • 语音识别】基于matlab MFCC GMM语音识别【含Matlab源码 535期】

    background model)算法,其与GMM区别在于:对L类整体样本训练一个大GMM,而不像GMM对每一类训练一个GMM模型。SVM的话MFCC作为特征,每一帧作为一个样本,可以借助VAD删除无效音频段,直接训练分类。近年来也有利用稀疏表达方法: 二、部分源代码 % ======

    作者: 海神之光
    发表时间: 2022-05-28 18:59:49
    353
    0
  • 语音识别】基于matlab DWT算法0~9数字语音识别【含Matlab源码 1726期】

    [摘 要]以一个能识别数字0~9语音识别系统实现过程为例,阐述了基于DTW算法特定人孤立词语音识别的基本原理和关键技术。其中包括对语音端点检测方法、特征参数计算方法和DTW算法实现详细讨论,最后给出了在Matlab下编程方法和实验结果。 1语音识别系统概述 语音识别系统典型原理框图如

    作者: 海神之光
    发表时间: 2022-05-28 16:58:01
    468
    0