内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 实时语音识别,如何在网页上使用websocket调用?

    你好,我最近在试用华为云实时语音识别功能,请问如何在网页上使用websocket调用呢?

    作者: Jaygu
    3397
    1
  • SIS实时语音识别C++版SDK使用指南

    今天要介绍主角是华为云SIS语音交互服务实时语音识别的C++版SDK(Linux版),接下来让我们一步步介绍该SDK安装与使用 前期准备 该工程基于CMake实现,所需要依赖仅包括g++和cmake。 g++版本建议4.8.5以上 cmake版本至少是3.14 CentOS系统

    作者: ASR-beginer
    发表时间: 2023-02-23 09:29:52
    3349
    0
  • 语音识别

    计算量:MFCC是在FBank基础上进行,所以MFCC计算量更大 特征区分度:FBank特征相关性较高,MFCC具有更好判别度,所以大多数语音识别论文中用是MFCC,而不是Fbank。而端到端方法基本都用Fbank l  为什么有DCT 其中DCT实质是去除各维信号之间相关性

    作者: xql
    发表时间: 2021-08-25 07:06:17
    2180
    0
  • 使用C++ SDK(Linux)调用实时语音识别

    使用C++ SDK(Linux)调用实时语音识别 前提条件 确保已按照配置CPP环境(Linux)配置完毕 初始化Client 初始化RasrClient,其参数包括AuthInfo

  • 语音识别】玩转语音识别 2 知识补充

    (Speech Recognition) 应用. 语音识别技术可以将语音转换为计算机可读输入, 让计算机明白我们要表达什么, 实现真正的人机交互. 希望通过本专栏学习, 大家能够对语音识别这一领域有一个基本了解. RNN RNN (Recurrent Neural Network)

    作者: 我是小白呀iamarookie
    发表时间: 2021-11-22 15:07:32
    2567
    0
  • ModelArts中文语音识别语音识别的实战经验

    com/forum/forum.php?mod=viewthread&tid=72297&page=1#pid314425作业1,如图按照作业1要求音频以上传,下载解压后如图,选择一个音频即可。图内代码如下import librosaimport IPythonimport librosa.displayimport

    作者: QGS
    4750
    1
  • 语音识别的问题

    你好,我有两个问题:1.ASR语音识别有没有四川话版本?2.四川话版本和普通话是可以自动识别转换还是需要手动切换?因为通话过程中,经常会有前一句是四川话后一句是普通话情况。

    作者: lola@HWCloud
    3686
    1
  • 什么是语音识别的智能客服?

    解码是指将经过模型训练的模型应用于新语音信号,以便将语音信号转换为文本。常用解码方法包括维特比算法和贪心搜索等。 智能客服基本原理 智能客服是指通过人工智能技术,解决用户问题。智能客服基本原理包括语音识别、自然语言处理和机器学习等。 语音识别 语音识别是智能客服核心技术之一。语音识别可以将用户语音输入转换为文本,以便后续的处理。

    作者: wljslmz
    发表时间: 2023-05-11 23:05:12
    20
    0
  • 语音识别ASR

    端到端”识别方式,一般采用深度神经网络(DNN),这种方式声学模型输入通常可以使用更原始信号特征(减少了编码阶段工作),输出也不再必须经过音素等底层元素,可以直接是字母或者汉字。在计算资源与模型训练数据充足情况下,“端到端”方式往往能达到更好效果。目前语音识别技

    作者: andyleung
    2546
    3
  • 语音识别模型

    OpenAI 一项语音处理项目,旨在实现语音识别、翻译和生成任务。作为基于深度学习语音识别模型,Whisper 具有高度智能化和准确性,能够有效地转换语音输入为文本,并在多种语言之间进行翻译。通过不断优化和更新,Whisper 致力于提供更加优质和高效语音处理解决方案

    作者: 霍格沃兹测试开发
    发表时间: 2024-10-29 17:30:40
    122
    0
  • 车载语音识别的算法

    车载语音识别系统主要采用自动语音识别ASR)技术,而ASR算法又可以分为基于规则算法和基于统计学习算法。基于规则算法主要是基于语言学和信号处理技术,通过设计规则和滤波器等手段,对输入语音信号进行处理和分析,提取出语音特征,然后与预定义词库进行匹配,找到最匹配词或短语

    作者: 运气男孩
    31
    0
  • 浅谈语音识别

    典+语音模型构建搜索空间,找到最合适路径。解码完成后最终输出文本。语音识别系统组成一个完整语音识别系统包括:预处理、特征提取、声学模型训练、语言模型训练、语音解码器。预处理对输入原始声音信号进行处理,过滤掉其中背景噪音、非重要信息,还要对找到语音信号开始和结束、语音

    作者: QGS
    47
    1
  • 语音识别

    作者: 宝哥哥
    527
    0
  • 语音识别的特殊之处

    度学习声学模型将此前各项基于传统声学模型识别案例错误率降低了一个层次,所以基于深度学习语音识别技术也正在逐渐成为语音识别领域核心。语音识别发展到如今,无论是基于传统声学模型语音识别系统还是基于深度学习语音识别系统,语音识别的各个模块都是分开优化。但是语音识别本质上是

    作者: 黄生
    31
    3
  • 语音识别

    地提取语言信号参数是进行语音信号处理关键。语音学语音学是语言学一个分支,是研究人类语言声音学科。主要研究语言发音机制,语音特性和在言谈中变化规律。狭义语音学对应英语中phonetics一词,关注重点在具体语音本质以及产生语音方法。与之相对是音韵学(或称音系学)

    作者: G-washington
    1745
    1
  • 语音识别】基于matlab GUI拨号语音识别【含Matlab源码 1753期】

    DTMF编解码器在编码时将击键或数字信息转换成双音信号并发送,解码时在收到DTMF信号中检测击键或数字信息存在性。一个DTMF信号由两个频率 音频信号叠加构成。这两个音频信号频率来自两组预分配频率组:行频组或列频组。每一对这样音频信号唯一表示一个数字或符号。电话机中通常有16个 按键,

    作者: 海神之光
    发表时间: 2022-05-28 14:42:44
    399
    0
  • 自动语音识别ASR

    自动语音识别ASR,Automatic Speech Recognition)是一种语音识别技术,其目标是通过对人类语音信号转换,将其中包含语音内容转换为计算机可读输入,例如按键、二进制编码或者字符序列。ASR实现需要经过以下主要步骤:预处理(Pre-processin

    作者: 运气男孩
    52
    0
  • Run in ModelArts实现中文语音识别

    本次直播讲解DFCNN全序列卷积神经网络和Transfomer原理,和使用ModelArts训练DFCNN+Transfomer 模型实现中文语音识别

    主讲人:Lancer 华为云AI开发支持布道师
    直播时间:2022/12/08 周四 19:00 - 20:30
  • 语音识别的应用场景

    应用场景详细描述语音搜索搜索内容直接以语音方式输入,让搜索更加高效。支持各种场景下语音搜索,比如地图导航、网页搜索等。人机交互通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验。

    作者: 极客潇
    1555
    1
  • 语音识别未来

    N-gram、word2vec等语音识别难点远场麦克风识别高噪音场景语音识别多人语音识别交谈背景语音识别非标准语音识别(变速,带有情绪等)未来展望更优算法与模型更先进麦克风阵列技术更先进声学模型与范式更强有力工具更深入特征方法和预处理方法多学科融合

    作者: G-washington
    1293
    1