内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • DFCNN + Transformer模型完成中文语音识别(三)

    for i in v: text.append(num2word[i]) return v, text 使用搭建好的语音识别系统进行测试 在这里显示出10条语音示例的原文拼音及识别结果、原文汉字及识别结果。 for i in range(10): print('\n示例'

    作者: HWCloudAI
    发表时间: 2022-12-19 03:41:11
    315
    0
  • 多语言语音识别挑战与解决方案

    **引言** 多语言语音识别是语音技术领域中的一个重要挑战。随着全球化的发展,不同语种之间的语音识别需求逐渐增加。本文将深入研究多语言语音识别所面临的挑战,并提出相应的解决方案。通过项目实例,我们将详细探讨挑战的性质以及采用的技术手段。 **项目介绍** 我们选择了一个涉及多国

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:27:58
    1
    0
  • 噪声环境下的语音识别挑战与解决方案

    引言 在现实生活中,语音识别系统经常面临噪声环境的挑战,例如街头嘈杂声、办公室背景声等。这些噪声会降低语音识别系统的性能,因此在噪声环境中实现准确的语音识别是一个重要而具有挑战性的任务。本文将深入研究噪声环境下的语音识别挑战,并提出相应的解决方案,结合实例进行详细讲解。 项目介绍

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:36:43
    0
    0
  • 【人工智能相关知识分享】语音识别声学特征

    LPC 线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对 LPC的

    作者: 某地瓜
    1852
    1
  • 【人工智能相关知识分享】语音识别语言模型

    语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概

    作者: 某地瓜
    936
    1
  • 基于React-Native0.55.4的语音识别项目全栈方案

    览器和Android6.0(API23)自带的浏览器,Android8.0(API26)自带的浏览器,结果是都不支持。二. 方案调研和新的坑o( ̄▽ ̄)d 既然从移动端直接访问Web应用时无法调起录音接口,至少是无法兼容很多系统和机型,如果不考虑直接原生开发Android的话,只有寄希望于Hybrid的方案了。2

    作者: 大史不说话
    发表时间: 2018-10-22 14:34:41
    8736
    0
  • 语音识别技术之说话人自适应技术

    adaptation》这篇文章来自爱丁堡大学,以下是摘要:        通过调整声学模型来补偿训练和测试条件之间的不匹配,例如通过适应看不见的说话人,可以改善ASR的识别性能。 说话人自适应方法的成功依赖于选择适合于自适应的权重并使用良好的自适应策略来更新这些权重以便不过拟合自适应数据。 在本文中,我

    作者: 可爱又积极
    1047
    2
  • 华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00(北京时间)停售通知

    00:00(北京时间)正式停售 “语音交互服务-语音识别-长语音识别”。华为云在此提醒您,产品停售后,该长语音识别接口将不可被调用。如果您需要继续使用长语音识别功能,请您在2019/10/24 00:00之前适配录音文件识别接口,即“语音交互服务-定制语音识别-录音文件识别”的接口。更多关于“

    作者: 华为云客户服务中心
    发表时间: 2019-10-08 15:20:57
    6059
    0
  • [python]基于faster whisper实时语音识别语音转文本

    Faster-Whisper项目包括一个web网页版本和一个命令行版本,同时项目内部已经整合了VAD算法。VAD是一种音频活动检测的算法,可以准确的把音频中的每一句话分离开来,让whisper更精准的定位语音开始和结束的位置。 faster whisper地址: https://github

    作者: futureflsl
    发表时间: 2023-12-31 20:51:28
    2
    0
  • 构建智能语音识别应用:自定义模型和实时识别

    处理识别结果(例如:输出识别结果、执行相应操作等) 这段代码创建了一个音频输入流,读取麦克风输入的音频数据,并使用训练好的模型进行实时识别。您可以根据实际需求对音频数据进行预处理和后处理。 结论 在本文中,我们探讨了如何构建智能语音识别应用程序,重点介绍了自定义模型的训练和实时识别的实现。通

    作者: 皮牙子抓饭
    发表时间: 2023-06-08 08:59:35
    20
    1
  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    语音识别技术的发展已有数十年发展历史,大体来看可以分成传统的识别的方法和基于深度学习网络的端到端的方法。 无论哪种方法,都会遵循“输入-编码-解码-输出”的过程。 图1 语音识别过程 编码过程:语音识别的输入是声音,属于计算机无法直接处理的信号,所以需要编码过程将其转变为数字信

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • Python智能语音识别语翻译平台|项目前端搭建

    HTML,JavaScript等技术的应用。 01、任务实现步骤 任务描述:本任务利用HTML和JavaScript等搭建智能语音识别与翻译平台的前端页面,包括index.htm、base.htm前端网页模板的编写以及错误页面404.htm的编写。 第一步:编写base

    作者: TiAmoZhang
    发表时间: 2023-12-06 00:04:44
    8
    0
  • android(3)

    静态注册:在AndroidManifest.xml中注册广播(称为静态注册)    <receiver android:name=".MyReceiver">     <intent-filter>      <action android:name="com.anjoyo.receiver"/>     </intent-filter> 

    作者: 泽宇-Li
    833
    3
  • 【问答官】ModelArts的语音识别技术优势在哪里?

    【问答官】ModelArts的语音识别技术优势在哪里?

    作者: zhengy1347049
    1149
    4
  • android(1)

    Layout 现在一般不用了;RelativeLayout :android:layout_toRightOf="@id/tel_label" //表示在tel_label的右边,用 id 来做相对布局android:layout_below="@id/content" //表示

    作者: 泽宇-Li
    1134
    4
  • 行业前沿技术对语音识别的影响

    引言 语音识别技术在过去几年取得了巨大的发展,但随着行业前沿技术的不断涌现,语音识别领域也在不断演进。本文将深入探讨行业前沿技术对语音识别的影响,包括技术原理、实际项目部署过程、示例应用,以及未来的发展方向。 项目介绍 语音识别作为自然语言处理的一个重要分支,受益于深度学习、自然

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:44:43
    7
    0
  • Android转型

    开发了很长时间的Android,但是最近想转型,不知道是转前端还是转java后端

    作者: 浮生闲半日
    3165
    10
  • Ubuntu20.04 使用Python实现全过程离线语音识别(包含语音唤醒,语音转文字,指令识别,文字转语音)-转载

    torchaudio  def voice_into_word():     asr_model = EncoderDecoderASR.from_hparams(source="speechbrain/asr-transformer-aishell",                

    作者: 泽宇-Li
    304
    2
  • AI学习记(语音识别)-第二集

    语音识别技术;“理解”需要自然语言处理技术;“回答”需要语音合成技术,三个步骤环环相扣,相辅相成。语音识别技术时对话交互的开端,时保证对话交互高效准确进行的基础。        语音识别技术子20世纪50年代开始步入萌芽阶段,发展至今,主流算法模型已经经历了四个阶段,包括模板匹配

    作者: @Wu
    1851
    4
  • 【入驻式求助】语音识别后调用动态库异常

    函数,日志显示能获取正常的语音识别结果,也能成功调用动态库的函数,结果正常。当我修改第 31 行为 <goto next="#test1"/>,即获取语音识别结果后去调用动态库的另一个函数 TISC_QueryKey,此时会出现获取不到语音识别结果,而且日志也卡死了,也没有看到任何

    作者: 凡小枫
    2754
    8