内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 数字人语音驱动

    数字人语音驱动 该场景示例代码以数字人语音驱动为例,介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。

  • 启动语音合成

    启动语音合成 您可以根据自己的业务逻辑进行优化、修改rtts.xml前端界面和RttsActivity.class代码,执行RttsActivity.class代码效果如下。 父主题: Android端调用语音交互服务

  • 实时语音识别

    实时语音识别 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言的语音识别,其中方言包括:四川话、粤语和上海话。

  • 基于MFCC特征提取和GMM训练语音信号识别matlab仿真

    GMM训练: 对每个语音类别(音素、词汇等)分别训练一个GMM模型,使用EM算法优化模型参数。 解码: 给定一个未知语音样本,计算其MFCC特征并与各个GMM模型进行比较,选择概率最高的模型作为预测结果。

    作者: 简简单单做算法
    发表时间: 2023-10-23 23:45:51
    190
    0
  • 语音AI小夜灯项目

    一、项目简介 使用ESP32-S3N8R8模块作为主控芯片,S3内核增加了用于加速神经网络计算和信号处理等的指令,这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的功能。

    作者: 攻城狮Wayne
    发表时间: 2024-01-03 21:08:28
    1310
    0
  • 语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

    因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。

    作者: 海神之光
    发表时间: 2022-05-28 18:56:58
    265
    0
  • 什么是语音识别的语音搜索?

    教育 语音搜索可以为教育用户提供更加快捷、便利的搜索服务,如查询资料、课程信息等。 语音搜索的未来发展 随着人工智能技术的不断发展,语音搜索的未来发展前景非常广阔。未来的语音搜索将会更加精准、便捷,同时还会实现更加智能化的操作,如语音交互等。

    作者: wljslmz
    发表时间: 2023-05-11 23:05:36
    25
    0
  • 什么是语音识别的语音助手?

    智能手表 语音助手可以与智能手表进行互动,如查看天气、播放音乐、发送短信等。语音助手可以使智能手表更加便捷,更加智能。 语音助手的未来发展 随着人工智能技术的不断进步,语音助手的未来发展前景非常广阔。

    作者: wljslmz
    发表时间: 2023-05-11 23:04:47
    24
    0
  • 【MindSpore】【语音识别】DFCNN网络训练loss不收敛

    我参考了Model Arts的例子想要用MindSpore也实现语音识别,根据脚本迁移了网络。网络最后是调通了,但是Loss不收敛,训练得到的模型推理结果比预期长了一段。请问有专家可以帮忙看看问题出在哪里吗?

    作者: Daniel46010140
    1740
    3
  • 调用语音合成

    可在指定路径里查看保存的音频 result = tts_client.get_tts_response(tts_request) print(json.dumps(result, indent=2, ensure_ascii=False)) if __name__ == '__main

  • AI语音处理-文字合成语音功能

    前言语音合成技术在生活中用越来越广泛,阅读听书、订单播报、智能硬件、语音导航 很多场景下都加入了语音播报功能。语音合成基于深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,可以模拟出不同人的声音,让应用APP、设备开口说话,还能智能化训练个性语音

    作者: DS小龙哥
    3070
    5
  • 语音语音识别介绍

    为了增强模型表征能力,获得更好的性能,上述任务可以通过深度神经网络单独训练或者联合训练语音识别 语音识别指的是将语音信号转化为文字序列,是所有基于语音交互的基础。 语音识别是语音领域最重要的任务,下面将进行详细介绍。

    作者: HWCloudAI
    发表时间: 2022-12-12 07:46:32
    373
    0
  • 实时语音识别连续模式

    vadTail 否 Integer 尾部最大静音时间,[0, 3000],默认500ms。

  • 语音合成WebSocket版

    具体信息请参见《API参考》中语音合成章节。

  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    两者都需要大量数据用来训练

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • 5分钟玩转AI语音合成

    在电脑中找到刚下载的文件,打开,就能听到转换后的语音内容了。 实验过程到此结束,赶快体验吧,5分钟真的可以实现文本到语音的转换,转换后还是个美女小姐姐的声音哦。

    作者: 加油O幸福
    发表时间: 2022-05-29 13:43:26
    1043
    0
  • DeleteDemoInfo 删除语音作业 - API

    该API属于VCM服务,描述: 删除语音作业接口URL: "/v2/{project_id}/services/audio-moderation/tasks/{task_id}"

  • 语音识别与语音控制

    语音控制 SSH连接OriginBot成功后,配置智能语音模块: #从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ .

    作者: 梦笔生花
    发表时间: 2024-10-16 22:01:04
    111
    0
  • 启动实时语音识别

    父主题: Android端调用语音交互服务

  • 语音合成 - 代码示例

    语音合成,调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业和个人提供个性化的发音服务。