内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。

  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。

  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别(ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-25 23:43:30
    63
    0
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别(ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-16 18:34:56
    0
    0
  • 人工智能语音识别技术介绍

    音域参数:傅利叶谱、梅尔频率到谱系数,主要用来提取语音内容以及音色的差别,用来更进一步辨别语音信息。 2、什么是语音识别 语音识别简单来说就是把语音内容自动转换为文字的过程,是人与机器交互的一种技术。 涉及领域:声学、人工智能、数字信号处理、心理学等方面。

    作者: IT技术分享社区
    发表时间: 2022-11-29 13:34:33
    199
    0
  • 【SDC】【语音对讲】web添加语音对讲功能

    【功能模块】通过搭建推流服务器(RTSP 转为 前端JSMpeg播放), 这个时候遇到问题, SDK可以语音对讲, web类型的是否可以对讲?

    作者: sfr
    2185
    1
  • 语音加密】基于matlab混沌+AES语音加密解密【含Matlab源码 1593期】

    一、混沌语音加密简介 语音的数据安全是网络语音通信的重要问题之一,混沌序列由于具有类随机性常被用作加密密钥

    作者: 海神之光
    发表时间: 2022-05-28 15:57:48
    273
    0
  • 百度语音识别笔记

    除了出色的效果,易用的体验,我们再看看这个项目中还有什么宝藏可以挖掘,果然我们发现项目中还包含丰富的预训练模型,并且语音识别和语音合成均支持自定义训练

    作者: 风吹稻花香
    发表时间: 2021-12-23 16:56:10
    866
    0
  • 语音采集】基于matlab GUI语音信号采集【含Matlab源码 291期】

    4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

    作者: 海神之光
    发表时间: 2022-05-28 19:43:26
    285
    0
  • 【CANN训练营】Ascend 910实现LeNet网络的minist手写数据训练

    一、环境及准备工作 CPU/GPU复现使用华为云ModelArts-CodeLab平台 Ascend复现使用华为云ModelArts-开发环境-Notebook 原始Lenet代码链接:https://gitee.com/lai-pengfei/LeNet 二、在CPU/GPU

    作者: JeffDing
    发表时间: 2022-07-07 03:42:51
    1068
    0
  • PyTorch分布式训练

    PyTorch分布式训练 PyTorch 是一个 Python 优先的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态神经网络。PyTorch的一大优势就是它的动态图计算特性。

    作者: 风吹稻花香
    发表时间: 2021-06-04 15:35:07
    1360
    0
  • 语音内容标注

    根据播放内容,在下方“语音内容”文本框中填写音频内容。 3. 输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。 **图1** 语音内容音频标注 !

    作者: 运气男孩
    428
    3
  • 语音识别(ASR)

    需要AI产品经理选择用户预期不苛刻的场景,或者在设计时管理好用户预期。

    作者: andyleung
    2569
    3
  • 语音合成】基于matlab语音信号变速【含Matlab源码 565期】

    按照新的语音时长,对帧数fn插值为fn‘。 将ai系数转化称LSF参数,对LSF参数插值。 将插值后的LSF系数重构为1-fn’帧线性预测系数ai’。 用预测系数ai’和基音参数合成语音。 PS.

    作者: 海神之光
    发表时间: 2022-05-28 18:00:14
    458
    0
  • 人工智能 - 语音识别

    第一款消费者听写产品Dragon Dictate于1990年发布,可以根据语音自动键入文字。然后,AT&T公司推出了一种语音识别应用程序,该程序无需人工即可路由呼叫。这些早期的系统或者具有适合特定环境的小型词汇表,需要由单个声音进行大量训练

    作者: 斑馬斑馬
    439
    0
  • CreateTtsa 创建语音驱动任务 - API

    该API属于MetaStudio服务,描述: 该接口用于创建驱动数字人表情、动作及语音的任务。接口URL: "/v1/{project_id}/ttsa-jobs"

  • 自动语音识别ASR

    语言模型训练(Language Model Training):语言模型用于估计某个词出现的概率。语言模型通常也由基于深度学习的神经网络实现,但它们更多关注的是语言的结构和语法,而非具体的声学特征。

    作者: 运气男孩
    70
    0
  • 零代码基础建立AI语音模型-快速上手

    第四步,标注,选择图片,右侧标签名上“如下图”,点击确定即可,如果数据还太少,可以自己添加数据,再点击同步数据源即可 第五步,标注完全后,点击开始训练 耐心等待训练结束即可 训练完成后点击部署,有免费CPU和增强型,一个免费一个收费,收费的算力很好 点击提交即可,耐心等待 部署时间大致

    作者: QGS
    发表时间: 2021-02-06 17:08:52
    4324
    0
  • [python]基于faster whisper实时语音识别语音转文本

    介绍: Faster-Whisper是一个基于OpenAI的Whisper模型的高效实现。它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎,优化了内存使用效率。

    作者: futureflsl
    发表时间: 2023-12-31 20:51:28
    2
    0
  • 语音情感识别的应用和挑战

    人工智能AI)产品和人的交互过程中,如果能够准确地把握人当前的情感状态,根据情感状态做出回应,可以极大地提升用户对AI产品的体验。这在商品推荐,舆论监控,人机对话等方面都有着重要的意义。

    作者: SSIL_SZT_ZS
    发表时间: 2021-08-26 09:02:18
    9245
    0
提示

您即将访问非华为云网站,请注意账号财产安全