内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 深度学习在语音识别中的应用

    智能语音助手 深度学习使得智能语音助手能够更准确地理解用户的自然语言指令,实现更自然、智能的对话体验。这包括了语音指令的识别和语义理解。 语音合成 深度学习在语音合成中的应用使得合成语音更加自然、流畅。模型能够学习到更自然的语音语调和韵律,提高了合成语音的自然度。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:19:48
    5
    0
  • TTS放音失败问题解决

    1.使用智能IVR新建流程后,流程配置完后,使用机器人测试ok,openeye测试时,流程中播放TTS放音,未播放语音问题问题解决:抓取主被叫跟踪消息发现交互类型不对,正确的应该是2(语音交互播放TTS内容),修改了流程的对话类型为语音导航,之前是聊天机器人2.使用客户的IVR流程

    作者: AICC支撑人员
    1196
    0
  • 如何用 ABAP 代码进行文本转语音的输出工作

    这一行包含了ole2incl的包含声明,该包含了用于处理OLE对象的ABAP功能。这是必要的,因为我们将使用OLE对象来与外部语音合成引擎进行交互。

    作者: Jerry Wang
    发表时间: 2023-10-28 09:32:55
    8
    0
  • SIS.0415 - 错误码

    错误信息: 语音合成请求体参数错误。 解决办法:请检查请求体是否准确。

  • ROS与科大讯飞语音集成:实现语音控制机器人小车

    前言 从这篇文章开始,我们学习机器人语音的交互,我们将在ROS上集成科大讯飞的中文语音,实现语音控制机器人小车运动。 关于语音识别和语音合成的原理 ,这里就不在赘述,有兴趣的朋友可以自己利用时间去学习和深究。

    作者: 梦笔生花
    发表时间: 2024-11-20 22:49:07
    212
    0
  • 关于tts放音格式的问题请教

    我想知道用文本的方式通过USM调用TTS放音,是怎样的一个处理方式,生成的语音流是8k8bit还是8k16bit或者USM和TTS服务有另外的对接放音方式。现在TTS和USM的对接协议是MRCP协议。

    作者: lmm
    1583
    2
  • 智能语音助手的发展与未来:开启人机交互的新篇章

    语音合成TTS语音合成是将文本转换为语音的过程。

    作者: Echo_Wish
    发表时间: 2024-12-30 08:14:24
    162
    0
  • 语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

    4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

    作者: 海神之光
    发表时间: 2022-05-28 15:14:43
    336
    0
  • RunAudioAssessment 语音评测 - API

    该API属于SIS服务,描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

  • Python 语音识别

    未来展望 更精准的语音识别: 使用更先进的语音识别算法,提高识别精度和速度。 更丰富的功能: 增加更多功能,例如语音合成语音翻译等。 更广泛的应用: 将语音识别技术应用于更多场景,例如医疗、教育等。

    作者: 红尘灯塔
    发表时间: 2025-02-03 23:12:33
    0
    0
  • 应用场景

    即时文本录入手机App上实时录音并即时提供转写的文本,例如语音输入法等。 人机交互通过语音合成,实现高品质的机器人发声,使得人机交互更加自然。 智能客服借助语音合成,联络中心可以用自然的声音与客户互动。

  • 在 Ubuntu 上使用 eSpeak 将文本文档转换为语音

    Ubuntu espeak 是一个用于英语(和其他几种语言)的语音合成器,它将文本转换为语音。 您可以直接在您的 Ubuntu 机器上执行 espeak 命令,无需任何安装或配置。 在本文中,让我们了解一下 espeak 命令的 8 个示例。

    作者: Tiamo_T
    发表时间: 2022-02-03 00:33:39
    1210
    0
  • 数字人语音驱动

    数字人语音驱动 该场景示例代码以数字人语音驱动为例,介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。

  • SIS.0410 - 错误码

    错误信息: 语音合成输入的audio_format参数非法。 解决办法:请检查请求参数是否正确。

  • SIS.0411 - 错误码

    错误信息: 语音合成输入的property参数非法。 解决办法:请检查请求参数是否正确。

  • 语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

    因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。

    作者: 海神之光
    发表时间: 2022-05-28 18:56:58
    265
    0
  • 语音识别(ASR)

    (2)语音合成TTS)1)研究内容是将文字转化为语音(朗读出来)的过程,目前有两种实现方法,分别是:拼接法和参数法。拼接法是把事先录制的大量语音切碎成基本单元存储起来,再根据需要选取拼接而成。这种方法输出语音质量较高,但是数据要求过大。

    作者: andyleung
    2553
    3
  • 微认证之路 AI智能语音识别计算器

    由系统根据音韵序列生成语音波形 1. 需要先进的语音合成技术,能按要求实时合成出高质量的语音流 15. 语音合成处理流程 1. 文本文件 2. 文本分析 3. 语音内部表示 4. 波形合成 5. 波形文件 6. 评估 16. 语音合成 1.

    作者: 千江有水千江月
    1964
    0
  • 实时语音识别

    实时语音识别 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言的语音识别,其中方言包括:四川话、粤语和上海话。

  • SIS.0604 - 错误码

    错误信息: 短语音识别文件大小不符合要求或语音合成字数超过上限。 解决办法:请尝试减小语音文件的大小或减少请求合成字数,注意使用OBS链接提交时,经过Base 64编码之后文件大小会增加。