内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音识别与语音控制原理介绍

    source /opt/tros/setup.bash # 从tros.b安装路径中拷贝出运行示例需要配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ . # 加载音频驱动,设备启动之后只需要加载一次 bash config/audio.sh

    作者: 二哈侠
    发表时间: 2024-09-19 23:20:30
    145
    0
  • 自动语音识别发展史

    自动语音识别语音识别技术就是让机器通过识别和理解把语音信号转变为相应文本或命令高端技术。语音识别技术所涉及领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。自动语音识别发展史1952年,贝尔研究所研究成功了世界上第一个能识别10个英文数字发音

    作者: G-washington
    2571
    1
  • 语音识别】基于matlab GUI动态时间规整算法(RTW)语音识别系统【含Matlab源码 341期】

    频率倒谱系数是基于人耳听觉特性提出, 将人耳听觉感知特性与人类语音产生结合起来得到一种特征参数。由于对输入信号不做假设和约束, 与输入信号特性无关, 因此, 具有较高鲁棒性。 当声音频率低于1000Hz时候, 人耳对声音感知近似满足线性关系;当声音频率高于1000Hz时候, 人耳对声音感知不再近似满足线性关系

    作者: 海神之光
    发表时间: 2022-05-28 16:44:19
    321
    0
  • 语音识别端到端模型解读(一)

    刻过去信息,若要考虑未来信息,只需把t时刻之后隐藏状态也用同样方式进行添加,双向FSMN计算公式如下: 其中,表示考虑过去信息阶数,表示考虑未来信息阶数。记忆模块输出可以视作t时刻上下文信息,与t时刻隐藏层输出一起送入下一隐藏层。下一隐藏层计算方式为:

    作者: perlisp
    发表时间: 2020-12-01 08:49:03
    3279
    0
  • 语音识别在社交媒体分析中应用

    社交媒体成为了人们分享信息、交流观点和表达情感主要平台之一。语音识别技术在社交媒体分析中发挥着越来越重要作用,帮助企业、研究机构等更好地理解用户声音、情感和需求。本文将深入研究语音识别在社交媒体分析中应用,包括技术原理、实际项目部署过程、示例应用,以及未来发展方向。 项目介绍 语音识别在社交媒体分析项

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:43:14
    3
    0
  • 【人工智能相关知识分享】语音识别系统实现

    语音识别系统选择识别基元要求是,有准确定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关音素建模,汉语协同发音不如英语严重,可以采用音节建模。系统所需训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供训练数据能力,会使得性能急剧下降。

    作者: 某地瓜
    2141
    1
  • 浅聊语音识别技术常用方法

    算法。 神经网络方法 (ANN)神经网络方法是在语音识别发展后期才有的一种新识别方法。它其实是一种模拟人类神经活动方法,同时具有人一些特性,如自动适应和自主学习。其较强归类能力和映射能力在语音识别技术中具有很高利用价值。业界将 ANN 与传统方法进行结合,各取所长

    作者: QGS
    8
    1
  • 语音识别功能介绍

    语音识别服务可以实现1分钟以内、不超过4MB音频到文字转换。对于用户上传完整录音文件,系统通过处理,生成语音对应文字内容。ASR优势效果出众使用深度学习技术,语音识别准确率超过95%。广泛支持支持中文普通话语音识别,满足多种场景下应用需求。稳定可靠成功应用于各类场景

    作者: 极客潇
    1653
    1
  • 语音识别语言模型:连接语音与文本

    多语种识别 未来语音识别系统将支持多种语言和方言识别,并能够在不同语言之间进行无缝切换。 B. 个性化识别 通过对用户语音习惯学习,未来系统将能够提供个性化识别服务,更准确地理解用户需求和偏好。 C. 语音合成与对话系统 结合语音识别和语音合成技术,未来将实现更加自然对话系统,提供更流畅的语音交互体验。

    作者: Y-StarryDreamer
    发表时间: 2024-08-10 12:51:30
    107
    0
  • 【入驻式求助】语音识别问题

    别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】正常声音说话,对于短语音识别,如客户说【对】【是】等等一两个字时,有比较大概率会被识别为静音异常为noinput,请问有什么方法可以优化一下吗

    作者: yy2019
    2346
    1
  • 语音识别与人工智能融合

    引言 语音识别与人工智能融合是当今科技领域一个重要方向。随着人工智能技术发展,语音识别系统逐渐实现了更高准确性和更广泛应用。本文将深入研究语音识别与人工智能融合,包括技术原理、实际项目部署过程以及未来发展方向。 项目介绍 我们选取了一个基于深度学习语音识别项目作为

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:24:35
    3
    0
  • 语音识别在汽车科技中应用

    车辆系统负担。 结论 语音识别在汽车科技中应用为驾驶员和乘客提供了更加便捷、安全交互方式。通过整合先进语音识别引擎和语音合成引擎,汽车系统能够实现更智能、个性化语音交互。未来,随着技术不断进步,语音识别在汽车科技中应用将进一步拓展,为用户提供更为智能驾驶和乘车体验。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:40:30
    3
    0
  • 浅浅了解语音识别技术框架 

    M具有很多优良特性。HMM模型状态跳转模型很适合人类语音短时平稳特性,可以对不断产生观测值(语音信号)进行方便统计建模;与HNN相伴生动态规划算法可以有效地实现对可变长度时间序列进行分段和分类功能;HMM应用范围广泛。只要选择不同生成概率密度,离散分布或者连续分

    作者: QGS
    35
    1
  • 语音识别】基于matlab GUI HMM 0~9数字和汉字语音识别(带面板)【含Matlab源码 1716期】

    隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。具体形式如下,这里设Q是所有可能状态集合,V是所有可能观测集合,即有: 3 前向算法 对于步骤一初始,是初始时刻状态i1 = q1和观测o1联合概率。步骤(2) 是前向概率递推公式,计算到时刻t+1部分观测序列为o1

    作者: 海神之光
    发表时间: 2022-05-28 17:31:08
    348
    0
  • 语音识别】基于matlab GUI BP神经网络0到10数字语音识别【含Matlab源码 672期】

    一、BP神经网络语音识别简介 1 对语音WAV文件和LAB文件进行处理,产生十个文件,每个文件对应于一个数字,存贮着该数字波形文件。(shujuzhengli.m) 2 分别利用上面十个文件训练出十个HMM模板,具体方法是:首先将语音波形文件分帧,以128个点为一帧,帧为64,每一帧通过mfcc

    作者: 海神之光
    发表时间: 2022-05-28 18:44:38
    292
    0
  • 语音识别】基于matlab GUI DTW MFCC 0-9数字语音识别(带面板)【含Matlab源码 385期】

    一个应用DTW说话人识别系统如图8-4所示。它是与文本有关说话人确认系统。它采用识别特征是BP FG(附听觉特征处理) , 匹配时采用DTW技术。其特点为:①在结构上基本沿用语音识别的系统。②利用使用过程中数据修正原模板,即当在某次使用过程 中某说话人被正确确认时使用此时输人特

    作者: 海神之光
    发表时间: 2022-05-28 20:10:56
    269
    0
  • 【人工智能相关知识分享】语音识别的技术发展

    计概率语言模型。 ⑶人工神经网络在语音识别应用研究兴起。在这些研究中,大部分采用基于反向传播算法(BP算法)多层感知网络。人工神经网络具有区分复杂分类边界能力,显然它十分有助于模式划分。特别是在电话语音识别方面,由于其有着广泛应用前景,成了当前语音识别应用一个热点。

    作者: 某地瓜
    2564
    1
  • 语音识别】基于matlab GUI语音识别信号灯图像模拟控制(带面板)【含Matlab源码 757期】

    所包括需求和询问做出合理分析,执行相关命令,而不是仅仅转换为书面文字。本案例以语音识别为理论基础,通过与模式识别相结合方式将其应用到信号灯图像模拟控制领域,实现对指定语音信号进行自动识别并自动关联信号灯图像效果,具有一定使用价值。 2 理论基础 语音信号端点检测

    作者: 海神之光
    发表时间: 2022-05-28 17:40:56
    364
    0
  • LF-MMI在语音识别应用

    I分母构建一个类似HCLG解码图,则该解码图中组合了MMI中声学模型和语言模型信息。我们提到一定要是有限,可枚举,当MMI分母和语音识别解码图是一样时,即以词Word作为语言模型单元,一般语音识别系统词级别在数十万到百万之间,即使做个简单bi-gram,其复杂度也

    作者: 作家小然
    发表时间: 2020-07-14 16:50:15
    9661
    1
  • ModelArts搭建中文语音识别系统【转载】

    识别和理解人类语音。除了传统语音识别技术之外,基于深度学习语音识别技术也逐渐发展起来。自动语音识别(Automatic Speech Recognition,ASR),也可以简称为语音识别。主要是将人类语音中词汇内容转换为计算机可读输入,一般都是可以理解文本内容,也有可

    作者: 浩泽学编程
    629
    4