内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。

  • 【CANN训练营】Ascend 910实现LeNet网络的minist手写数据训练

    一、环境及准备工作 CPU/GPU复现使用华为云ModelArts-CodeLab平台 Ascend复现使用华为云ModelArts-开发环境-Notebook 原始Lenet代码链接:https://gitee.com/lai-pengfei/LeNet 二、在CPU/GPU

    作者: JeffDing
    发表时间: 2022-07-07 03:42:51
    1068
    0
  • AI语音识别-我给浏览器加了个语音搜索功能

    创建语音服务器2.1 使用语音服务登录华为云官网: cid:link_4选择产品-人工智能-语音交互服务-一句话识别。 短语音识别地址: cid:link_2短语音识别是将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。

    作者: DS小龙哥
    38
    4
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别(ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-25 23:43:30
    63
    0
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展

    近年来,语音技术在人工智能领域的发展极为迅速,语音识别(ASR)和文本转语音(TTS)作为两项重要的核心技术,被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题,共同助力于实现自然、流畅的人机对话。

    作者: kwan的解忧杂货铺
    发表时间: 2024-11-16 18:34:56
    0
    0
  • 人工智能语音识别技术介绍

    音域参数:傅利叶谱、梅尔频率到谱系数,主要用来提取语音内容以及音色的差别,用来更进一步辨别语音信息。 2、什么是语音识别 语音识别简单来说就是把语音内容自动转换为文字的过程,是人与机器交互的一种技术。 涉及领域:声学、人工智能、数字信号处理、心理学等方面。

    作者: IT技术分享社区
    发表时间: 2022-11-29 13:34:33
    199
    0
  • 【SDC】【语音对讲】web添加语音对讲功能

    【功能模块】通过搭建推流服务器(RTSP 转为 前端JSMpeg播放), 这个时候遇到问题, SDK可以语音对讲, web类型的是否可以对讲?

    作者: sfr
    2185
    1
  • PyTorch分布式训练

    PyTorch分布式训练 PyTorch 是一个 Python 优先的深度学习框架,能够在强大的 GPU 加速基础上实现张量和动态神经网络。PyTorch的一大优势就是它的动态图计算特性。

    作者: 风吹稻花香
    发表时间: 2021-06-04 15:35:07
    1360
    0
  • 百度语音识别笔记

    除了出色的效果,易用的体验,我们再看看这个项目中还有什么宝藏可以挖掘,果然我们发现项目中还包含丰富的预训练模型,并且语音识别和语音合成均支持自定义训练

    作者: 风吹稻花香
    发表时间: 2021-12-23 16:56:10
    866
    0
  • 语音加密】基于matlab混沌+AES语音加密解密【含Matlab源码 1593期】

    一、混沌语音加密简介 语音的数据安全是网络语音通信的重要问题之一,混沌序列由于具有类随机性常被用作加密密钥

    作者: 海神之光
    发表时间: 2022-05-28 15:57:48
    273
    0
  • 语音采集】基于matlab GUI语音信号采集【含Matlab源码 291期】

    4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

    作者: 海神之光
    发表时间: 2022-05-28 19:43:26
    285
    0
  • CreateTtsa 创建语音驱动任务 - API

    该API属于MetaStudio服务,描述: 该接口用于创建驱动数字人表情、动作及语音的任务。接口URL: "/v1/{project_id}/ttsa-jobs"

  • 零代码基础建立AI语音模型-快速上手

    第四步,标注,选择图片,右侧标签名上“如下图”,点击确定即可,如果数据还太少,可以自己添加数据,再点击同步数据源即可 第五步,标注完全后,点击开始训练 耐心等待训练结束即可 训练完成后点击部署,有免费CPU和增强型,一个免费一个收费,收费的算力很好 点击提交即可,耐心等待 部署时间大致

    作者: QGS
    发表时间: 2021-02-06 17:08:52
    4324
    0
  • 语音识别

    语音处理语音信号处理(speech signal processing)简称语音处理。•语音处理是用以研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。

    作者: G-washington
    1745
    1
  • AICC产品】【语音转写握手失败】

    【问题来源】    【新点软件】    【问题简要】语音转写功能握手失败【问题类别】    【可选问题分类:AICC】【AICC解决方案版本】    【AICC 8.13.0】【期望解决时间】【2021-07-07 11:40:00】接口地址:https://139.9.50.74

    作者: 新点-徐亚柏
    1253
    6
  • 语音合成】基于matlab语音信号变速【含Matlab源码 565期】

    按照新的语音时长,对帧数fn插值为fn‘。 将ai系数转化称LSF参数,对LSF参数插值。 将插值后的LSF系数重构为1-fn’帧线性预测系数ai’。 用预测系数ai’和基音参数合成语音。 PS.

    作者: 海神之光
    发表时间: 2022-05-28 18:00:14
    458
    0
  • 语音内容标注

    根据播放内容,在下方“语音内容”文本框中填写音频内容。 3. 输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。 **图1** 语音内容音频标注 !

    作者: 运气男孩
    427
    3
  • kaldi语音识别 chain模型的数据准备

    step 7:验证集和训练子集的egs生成。主要涉及三个函数:lattice-align-phones、chain-get-supervision和nnet3-chain-get-egs step 8:正式生成训练集的egs。注意,此时生成的文件名叫cegs_orig.JOB.

    作者: ASR-beginer
    发表时间: 2020-07-02 11:00:32
    11793
    0
  • 语音情感识别的应用和挑战

    人工智能AI)产品和人的交互过程中,如果能够准确地把握人当前的情感状态,根据情感状态做出回应,可以极大地提升用户对AI产品的体验。这在商品推荐,舆论监控,人机对话等方面都有着重要的意义。

    作者: SSIL_SZT_ZS
    发表时间: 2021-08-26 09:02:18
    9245
    0
  • python文本转女生语音

    2.1 第一次发音朗读 import pyttsx3 engine = pyttsx3.init() engine.say('我爱你,川川') engine.runAndWait() 2.2 将语音保存到mp3

    作者: 川川菜鸟
    发表时间: 2022-04-13 18:55:41
    458
    0