内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 基于华为云ModelArts深度学习算法语音识别实践

    zip')至此基于深度学习算法语音识别实践全部完成,整个流程下来体验还是很不错!总结整个流程用到了很多华为云服务,例如OBS和ModelArtsNoteBook,功能非常强大,体验感很好,对深度学习算法语音识别有了一定了解,也对整个实践过程有了认识,欢迎大家一起在华

    作者: 运气男孩
    865
    12
  • 语音识别?开灯关灯轻松切换?!Atlas 200I DK A2帮你实现

    报名活动,填写活动码:“CANN和小藤”,即可领取Atlas 200I DK A2开发者套件85折折扣券!!! ​微信扫码添加【昇腾小助手】,了解Atlas 200I DK A2开发者套件7折折扣券领取方式!!! 活动报名 昇腾社区直播入口 B站直播入口

    作者: 哈小主
    发表时间: 2023-07-11 11:02:16
    136
    0
  • 关于《基于深度学习算法语音识别》沙箱实验建议

    问题描述: 实验中上传本地数据至自己创建OBS过程非常费时,拷贝代码功能不太完善 建议方案: 感觉这个实验完全没有必要把训练用数据,先从https://sandbox-experiment-resource-north-4.obs.cn-north-4.myhuaweicloud

    作者: 侠岚
    发表时间: 2021-12-27 10:47:02
    948
    0
  • 【Atlas】【中文语音识别】请问使用wav文件有什么要求

    s/level1_single_api/5_200dk_peripheral/mic可以使用Atlas 200 DK进行录音,但是录音生成是.pcm文件,我想通过Python对.pcm转成.wav,所以请问对声道数、量化位数、采样频率、采样点数等有何要求?

    作者: 岁寒良木
    531
    1
  • 语音识别】基于matlab矢量量化(VQ)说话人识别【含Matlab源码 575期】

    目前自动说话人识别的方法主要是基于参数模型HMM方法和基于非参数模型VQ方法。1992年, 日本人Matsui和Fur ui主要从对语声波动鲁棒性方面对基于VQ方法和各态历经离散和连续HMM方法进行了比较。他们发现连续各态历经HMM方法比离散各态历经HMM方法优越, 当可用于训练数据量较小时,

    作者: 海神之光
    发表时间: 2022-05-29 16:34:53
    348
    0
  • 【入驻式求助】关于语音识别超时后自动挂断问题

    【问题简要】语音识别超时会挂断【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】科大那边做语音识别,设置了识别时长为一分钟,实际测试发现,如果超过一分钟就会自动挂断,看日志流程也终止不走了,也没有拆线操作,日志如图,测试流程请看附件

    作者: yy2019
    3575
    5
  • 《攻克LSTM语音识别“语速关”:技术新突破与解决方案》

    行建模,更好地利用语音上下文信息。对于不同语速语音,双向LSTM能够更全面地捕捉语音前后依赖关系,从而提高对语速变化适应性。 - 增加模型深度和宽度:适当增加LSTM模型深度和宽度,以提高模型表示能力。更多隐藏层和神经元可以让模型学习到更复杂语速特征和语音模式,增

    作者: 程序员阿伟
    发表时间: 2025-02-11 15:53:30
    0
    0
  • 语音识别】基于matlab GUI声纹识别(带面板)【含Matlab源码 537期】

    一、案例简介 本文基于Matlab设计实现了一个文本相关声纹识别系统,可以判定说话人身份。 1 系统原理 a 声纹识别 这两年随着人工智能发展,不少手机App都推出了声纹锁功能。这里面所采用主要就是声纹识别相关技术。声纹识别又叫说话人识别,它和语音识别存在一点差别。 b 梅尔频率倒谱系数(MFCC)

    作者: 海神之光
    发表时间: 2022-05-28 18:26:58
    321
    0
  • 【语音增强】基于matlab匹配滤波器语音识别【含Matlab源码 514期】

    张直中老师可以说是新中国雷达事业开拓者之一。就目前阅读范围来看,张老师在其早期著作《雷达信号选择与处理》一书中对匹配滤波器讲解最为透彻。说句题外话,这本1979年出版老书,充满了哲学思辨色彩,让人读起来满口余香,也能让我们充分领略老一辈科学家宽广深厚学术素养。 所谓最优滤波器,实

    作者: 海神之光
    发表时间: 2022-05-28 18:19:41
    300
    0
  • 【人工智能相关知识分享】语音识别技术发展史

    10个英文数字发音实验系统。 1960年英国Denes等人研究成功了第一个计算机语音识别系统。 大规模语音识别研究是在进入了70年代以后,在小词汇量、孤立词识别方面取得了实质性进展。 进入80年代以后,研究重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生

    作者: 某地瓜
    1970
    1
  • 实时数据处理

    实时数据处理 实时收集城市各交通枢纽车辆通行数据,缓存在通道中,分析平台周期读取通道中数据分析后将结果应用到调度系统,实现对停车场开放时长和交通资源调配。 图1 场景示例图 父主题: 应用场景

  • 方案概述

    如何实现在高并发场景下快速实时进行语音识别。 方案架构 图1 方案架构 架构图说明: 创建语音识别作业提交函数(Push_Transcriber_Jobs),该函数可以通过调取语音识别服务“提交

  • 基于React-Native0.55.4语音识别项目全栈方案

    API语音识别方案可参考《【Recorder.js+百度语音识别】全栈方案技术细节》一文。1. 调用Web API多媒体采集接口需要特定域Web API多媒体接口是WebRTC技术在PC端实现,由于多媒体采集涉及到用户隐私,所以在浏览器端调用这个接口需要在安全域下才能

    作者: 大史不说话
    发表时间: 2018-10-22 14:34:41
    8736
    0
  • 通过无服务器API构建语音识别Web应用 - 代码示例

    通过函数工作流和APIG触发器构建一个无服务器API,在函数中调用人工智能服务提供语音识别接口,实现语音识别功能,将语音转化为文字。

  • 通过无服务器API构建语音识别Web应用 - 代码示例

    通过函数工作流和APIG触发器构建一个无服务器API,在函数中调用人工智能服务提供语音识别接口,实现语音识别功能,将语音转化为文字。

  • 【Recorder.js+百度语音识别】全栈方案技术细节

    绑定额外监听器:这样我们就可以在自己逻辑代码或二次封装代码中实现对转码动作监听。方法三:Promise化使用Promise来实现异步调用,将音频处理代码剥离出去,最终调用方式为:参考代码如下:三. Recorder.js功能扩展百度AI语音识别接口接收语音文件需

    作者: 大史不说话
    发表时间: 2018-08-29 10:05:42
    8495
    0
  • 实时作业管理

    实时作业管理

  • Python用ctypes调用动态库方式使用科大讯飞语音识别

    Python 一个模块,它提供了C语言相关数据类型,可以方便调用C语言编写DLL(Windows 动态链接库)和so(Linux动态链接库)。科大讯飞语音识别客户端SDK提供了Linux下C语言SDK,却没有Python。有了ctypes,我们就可以很轻松用Pytho

    作者: 红皮橘子
    发表时间: 2019-02-02 17:14:01
    7457
    0
  • [自然语言处理|NLP] 语音识别应用:从原理到实践

    此示例目的是提供一个基本框架,以帮助理解NLP技术在语音识别实际应用。 5. 面临挑战与未来发展 5.1 挑战 语音多样性: 不同人发音、语速、口音等差异使得语音识别面临更大挑战。 噪声环境: 在嘈杂环境中进行语音识别仍然是一个难题,需要更好噪声抑制和去除技术。

    作者: Y-StarryDreamer
    发表时间: 2023-11-15 12:54:28
    37
    0
  • 【人工智能相关知识分享】语音识别技术在中国发展

    中国语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件限制,中国语音识别研究工作一直处于缓慢发展阶段。 进入80年代以后,随着计算机应用技术在中国逐渐普及和应用以及数字信号技术

    作者: 某地瓜
    1343
    1