内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音识别 - 主要步骤

     声音三个主要主要属性,即音量(响度)、音调、音色(也称音品)。    声音音量(volume),即音频强度和幅度;    声音音调,也称为音高(pitch),即音频频率或每秒变化次数;    声音音色(timbre),即音频泛音或谐波成分。音品  每个人发音都

    作者: 学习怪
    641
    3
  • 浅谈ASR语音识别

    语音识别(Automatic Speech Recognition,ASR)是一种将人类语音信号转换为文本或命令技术。其基础原理涉及到声学特征提取、声学模型建立和语言模型应用。以下是ASR基础原理:1. 声学特征提取ASR第一步是从语音信号中提取特征,这通常涉及以下几种技术:短时能量和短时过零率:

    作者: 运气男孩
    20
    1
  • 定制语音识别和短语音识别服务区别

    发现语音识别服务中有一个定制语音识别,其实这个功能和短语音识别功能类似。对于没有定制需求用户,直接使用定制语音识别的接口即可,与语短音识别接口差别不大。定制语音识别服务支持热词,接受垂直领域模型、特殊方案定制需求。 定制需要收取一定定制费,定制流程以及费用。

    作者: 极客潇
    963
    1
  • 语音识别在医疗领域应用

    患者病历快速而准确记录。我们将使用深度学习模型,如长短时记忆网络(LSTM),以展示语音识别在医疗领域实际应用。 技术原理 语音识别技术 语音识别技术在医疗领域应用主要通过将医生口头输入转化为文字,实现病历记录自动化。深度学习模型,尤其是循环神经网络(RNN)和转录

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:25:52
    1
    0
  • 语音识别】基于matlab GUI智能语音识别门禁系统【含Matlab源码 596期】

    一、案例简介 本文基于Matlab设计实现了一个文本相关声纹识别系统,可以判定说话人身份。 1 系统原理 a 声纹识别 这两年随着人工智能发展,不少手机App都推出了声纹锁功能。这里面所采用主要就是声纹识别相关技术。声纹识别又叫说话人识别,它和语音识别存在一点差别。 b 梅尔频率倒谱系数(MFCC)

    作者: 海神之光
    发表时间: 2022-05-28 20:18:17
    335
    0
  • 语音识别模块原理

    语音识别模块是一种基于嵌入式技术模块,主要用于将人类语音中词语转换成计算机可读格式,实现与主芯片通讯。该模块通常包括语音识别芯片和其他附属电路,使得开发者能够方便地将其嵌入到各种智能化产品中,实现人机语音交互。语音识别模块基本原理可以分为训练和识别两个阶段。在训练阶段,

    作者: DevFeng
    20
    1
  • 人工智能:语音识别技术介绍

    以及音色差别,用来更进一步辨别语音信息。 2、什么是语音识别 语音识别简单来说就是把语音内容自动转换为文字过程,是人与机器交互一种技术。 涉及领域:声学、人工智能、数字信号处理、心理学等方面。 语音识别的输入:对一段声音文件进行播放序列。 语音识别的输出:输出结果是一段文本序列。

    作者: IT技术分享社区
    发表时间: 2022-11-29 13:34:33
    199
    0
  • 百度语音识别笔记

    get. 合成音频 1 音频4音频:00:00/00:04 输入文本 2 早上好,今天是2020/10/29,最低温度是-3°C。 合成音频 2 音频5音频:00:00/00:05 可以看到,无论是中英文识别,还是中英文合成,这个开源项目都有不错效果,特别的

    作者: 风吹稻花香
    发表时间: 2021-12-23 16:56:10
    866
    0
  • 使用Python实现语音识别与处理模型

    通过本文的介绍,我们了解了语音识别与处理基本原理和实现方法,并使用Python实现了一个简单语音识别模型。在实际应用中,我们可以根据需求选择不同特征提取方法和模型来进一步优化语音识别系统。 希望本文能够帮助读者理解语音识别与处理技术概念和实现方法,并能够在实际项目中应用Python来构建自己语音识别系统。

    作者: Echo_Wish
    发表时间: 2024-04-23 09:02:56
    63
    0
  • 语音识别】基于matlab电话按键语音识别(含按键录音)【含Matlab源码 1752期】

    一、获取代码方式 获取代码方式1: 完整代码已上传我资源:【语音识别】基于matlab电话按键语音识别(含按键录音)【含Matlab源码 1752期】 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭支付凭证,私信博主,可获得此代码。

    作者: 海神之光
    发表时间: 2022-05-28 16:49:19
    465
    0
  • 语音识别全链路

    复制性设计,以确保系统可靠性和一致性。这种标准化和可复制性在语音处理领域非常重要,因为不同系统和算法可能会产生不同结果,这可能会影响语音合成质量和可读性。因此,为了实现高质量语音合成和转写,需要不断优化和改进这两个系统,并确保它们能够协同工作。以我们日常询问逻辑来说

    作者: 运气男孩
    32
    0
  • 语音识别技术属于什么技术

    别完成。语音识别技术有着很强可变性,也存在着一些挑战,比如说话口音、风格问题、文字表达复杂度难度大、大量词汇堆积、语法、适用性差噪音干扰性大、信道问题、声学环境中麦克风和传输空间距离变化,以及一些具有挑战性应用场景,比如多语种交流,这都是语音识别技术需要解决问题,沐

    作者: DevFeng
    27
    1
  • 聊聊语音识别技术前景

    对特定人语音识别系统识别精度就更高。这些技术已经能够满足通常应用要求。由于大规模集成电路技术发展,这些复杂语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,

    作者: QGS
    32
    1
  • 语音识别系统组成

    处理与特征提取可以视作音频数据预处理部分,一般来说,一段高保真、无噪声语言是非常难得,在实际研究中用到语音片段或多或少都有噪声,所以在正式进入声学模型之前,需要通过消除噪声和信道增强等预处理技术,将信号从时域转化到频域,然后为之后声学模型提取有效特征向量。接下来声学模

    作者: 黄生
    29
    2
  • 华为云语音识别应用

    点。使用服务:语音识别如何解决:引入华为云语音识别技术"使用场景:语音转文字,把采访视频中语音生成文字。 业务架构图/方案截图:使用规模: 100小时/月提高工作效率:提高效率、节省了大量的人力成本,文字生成速度快、准确率高。建议: 方言识别能力弱,这个确实不好解决作者: 老杨

    作者: 老杨0311
    6227
    4
  • 【转载】语音与语音识别介绍

    一、语音领域知识介绍 音频特征音频数据常见音频任务二、语音识别知识介绍技术历程语音识别的流程声学模型语言模型语音识别的挑战三、音频数据读取与处理

    作者: emilyleungbaby
    1147
    1
  • 深度学习之语音识别

    “6’’ 和 “9’’ 区别,所以对这些任务来说,水平翻转和旋转180◦ 并不是合适数据集增强方式。能保持我们希望分类不变,但不容易执行转换也是存在。例如,平面外绕轴转动难以通过简单几何运算在输入像素上实现。数据集增强对语音识别任务也是有效 (Jaitly and Hinton

    作者: 小强鼓掌
    831
    4
  • IVR 获取语音识别结果

    【问题简要】IVR 获取语音识别结果【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】您好!我们使用 vxml 2.0 开发 IVR 流程,下图为 asr 测试流程从开始说话到获取结果 IVR 侧日志截图:请问,平台是如何解析 asr 厂商返

    作者: 凡小枫
    16362
    17
  • 华为 语音识别,支持方言吗?

    华为 语音识别,支持方言吗?

    作者: 福州司马懿
    175
    5
  • 【入驻式求助】关于语音识别日志里语音识别开始和结束问题

    【问题简要】语音识别日志哪一条输出日志说明是已经说完话,那一句是开始有了结果,哪一句是开始识别【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】日志如下:特别是红色字体意思是什么2019-07-11 20:08:03.662   10

    作者: yy2019
    7721
    13