搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

深度学习在语音识别中的应用
深度学习在语音识别中的应用

智能语音助手深度学习使得智能语音助手能够更准确地理解用户的自然语言指令，实现更自然、智能的对话体验。这包括了语音指令的识别和语义理解。语音合成深度学习在语音合成中的应用使得合成语音更加自然、流畅。模型能够学习到更自然的语音语调和韵律，提高了合成语音的自然度。

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:19:48

5

0
TTS放音失败问题解决
TTS放音失败问题解决

1.使用智能IVR新建流程后，流程配置完后，使用机器人测试ok，openeye测试时，流程中播放TTS放音，未播放语音问题问题解决：抓取主被叫跟踪消息发现交互类型不对，正确的应该是2（语音交互播放TTS内容），修改了流程的对话类型为语音导航，之前是聊天机器人2.使用客户的IVR流程

开发者 > 其他

作者： AICC支撑人员

1196

0
如何用 ABAP 代码进行文本转语音的输出工作

这一行包含了ole2incl库的包含声明，该库包含了用于处理OLE对象的ABAP功能。这是必要的，因为我们将使用OLE对象来与外部语音合成引擎进行交互。

开发者 > 博客

作者： Jerry Wang

发表时间： 2023-10-28 09:32:55

8

0
SIS.0415 - 错误码
SIS.0415 - 错误码

错误信息: 语音合成请求体参数错误。解决办法：请检查请求体是否准确。

开发者 > 开发工具
ROS与科大讯飞语音库集成：实现语音控制机器人小车

前言从这篇文章开始，我们学习机器人语音的交互，我们将在ROS上集成科大讯飞的中文语音库，实现语音控制机器人小车运动。关于语音识别和语音合成的原理，这里就不在赘述，有兴趣的朋友可以自己利用时间去学习和深究。

开发者 > 博客

作者：梦笔生花

发表时间： 2024-11-20 22:49:07

212

0
关于tts放音格式的问题请教
关于tts放音格式的问题请教

我想知道用文本的方式通过USM调用TTS放音，是怎样的一个处理方式，生成的语音流是8k8bit还是8k16bit或者USM和TTS服务有另外的对接放音方式。现在TTS和USM的对接协议是MRCP协议。

开发者 > 其他

作者： lmm

1583

2
智能语音助手的发展与未来：开启人机交互的新篇章

语音合成（TTS）语音合成是将文本转换为语音的过程。

开发者 > 博客

作者： Echo_Wish

发表时间： 2024-12-30 08:14:24

162

0
【语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

4.4 语音信号的频域分析语音信号的频域分析就是分析语音信号的频域持征。从广义上讲，语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等，而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:14:43

336

0
RunAudioAssessment 语音评测 - API
RunAudioAssessment 语音评测 - API

该API属于SIS服务，描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

开发者 > 开发工具
Python 语音识别
Python 语音识别

未来展望更精准的语音识别: 使用更先进的语音识别算法，提高识别精度和速度。更丰富的功能: 增加更多功能，例如语音合成、语音翻译等。更广泛的应用: 将语音识别技术应用于更多场景，例如医疗、教育等。

开发者 > 博客

作者：红尘灯塔

发表时间： 2025-02-03 23:12:33

0

0
应用场景
应用场景

即时文本录入手机App上实时录音并即时提供转写的文本，例如语音输入法等。人机交互通过语音合成，实现高品质的机器人发声，使得人机交互更加自然。智能客服借助语音合成，联络中心可以用自然的声音与客户互动。

开发者 > 开发服务
在 Ubuntu 上使用 eSpeak 将文本文档转换为语音

Ubuntu espeak 是一个用于英语（和其他几种语言）的语音合成器，它将文本转换为语音。您可以直接在您的 Ubuntu 机器上执行 espeak 命令，无需任何安装或配置。在本文中，让我们了解一下 espeak 命令的 8 个示例。

开发者 > 博客

作者： Tiamo_T

发表时间： 2022-02-03 00:33:39

1210

0
数字人语音驱动
数字人语音驱动

数字人语音驱动该场景示例代码以数字人语音驱动为例，介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。

开发者 > 开发服务
SIS.0410 - 错误码
SIS.0410 - 错误码

错误信息: 语音合成输入的audio_format参数非法。解决办法：请检查请求参数是否正确。

开发者 > 开发工具
SIS.0411 - 错误码
SIS.0411 - 错误码

错误信息: 语音合成输入的property参数非法。解决办法：请检查请求参数是否正确。

开发者 > 开发工具
【语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

因为语音波是一个非平稳过程，因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号，而应该用短时傅里叶变换对语音信号的频谱进行分析，相应的频谱称为“短时谱”。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 18:56:58

265

0
语音识别（ASR）
语音识别（ASR）

（2）语音合成（TTS）1）研究内容是将文字转化为语音（朗读出来）的过程，目前有两种实现方法，分别是：拼接法和参数法。拼接法是把事先录制的大量语音切碎成基本单元存储起来，再根据需要选取拼接而成。这种方法输出语音质量较高，但是数据库要求过大。

开发者 > 其他

作者： andyleung

2553

3
微认证之路 AI智能语音识别计算器

由系统根据音韵序列生成语音波形 1. 需要先进的语音合成技术，能按要求实时合成出高质量的语音流 15. 语音合成处理流程 1. 文本文件 2. 文本分析 3. 语音内部表示 4. 波形合成 5. 波形文件 6. 评估 16. 语音合成 1.

开发者 > 其他

作者：千江有水千江月

1964

0
实时语音识别
实时语音识别

实时语音识别支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。支持中文普通话、方言的语音识别，其中方言包括：四川话、粤语和上海话。

开发者 > 开发服务
SIS.0604 - 错误码
SIS.0604 - 错误码

错误信息: 短语音识别文件大小不符合要求或语音合成字数超过上限。解决办法：请尝试减小语音文件的大小或减少请求合成字数，注意使用OBS链接提交时，经过Base 64编码之后文件大小会增加。

开发者 > 开发工具

总条数： 10000

上一页
1
...
7
8
9
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

深度学习在语音识别中的应用

TTS放音失败问题解决

如何用 ABAP 代码进行文本转语音的输出工作

SIS.0415 - 错误码

ROS与科大讯飞语音库集成：实现语音控制机器人小车

关于tts放音格式的问题请教

智能语音助手的发展与未来：开启人机交互的新篇章

【语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

RunAudioAssessment 语音评测 - API

Python 语音识别

应用场景

在 Ubuntu 上使用 eSpeak 将文本文档转换为语音

数字人语音驱动

SIS.0410 - 错误码

SIS.0411 - 错误码

【语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

语音识别（ASR）

微认证之路 AI智能语音识别计算器

实时语音识别

SIS.0604 - 错误码

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线