搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

调用语音合成
调用语音合成

property 否 String 特征字符串，{language}_{speaker}_{domain}，默认chinese_xiaoqi_common。

开发者 > 开发服务
数字人语音驱动
数字人语音驱动

数字人语音驱动该场景示例代码以数字人语音驱动为例，介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。

开发者 > 开发服务
什么是语音识别的语音助手？
什么是语音识别的语音助手？

智能手表语音助手可以与智能手表进行互动，如查看天气、播放音乐、发送短信等。语音助手可以使智能手表更加便捷，更加智能。语音助手的未来发展随着人工智能技术的不断进步，语音助手的未来发展前景非常广阔。

开发者 > 博客

作者： wljslmz

发表时间： 2023-05-11 23:04:47

24

0
启动语音合成
启动语音合成

启动语音合成您可以根据自己的业务逻辑进行优化、修改rtts.xml前端界面和RttsActivity.class代码，执行RttsActivity.class代码效果如下。父主题： Android端调用语音交互服务

开发者 > 开发服务
实时语音识别
实时语音识别

实时语音识别支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。音频采样率8KHz或者16KHz，采样位数8bit或者16bit。支持中文普通话、方言的语音识别，其中方言包括：四川话、粤语和上海话。

开发者 > 开发服务
什么是语音识别的语音搜索？
什么是语音识别的语音搜索？

教育语音搜索可以为教育用户提供更加快捷、便利的搜索服务，如查询资料、课程信息等。语音搜索的未来发展随着人工智能技术的不断发展，语音搜索的未来发展前景非常广阔。未来的语音搜索将会更加精准、便捷，同时还会实现更加智能化的操作，如语音交互等。

开发者 > 博客

作者： wljslmz

发表时间： 2023-05-11 23:05:36

25

0
基于MFCC特征提取和GMM训练的语音信号识别matlab仿真

GMM训练：对每个语音类别（音素、词汇等）分别训练一个GMM模型，使用EM算法优化模型参数。解码：给定一个未知语音样本，计算其MFCC特征并与各个GMM模型进行比较，选择概率最高的模型作为预测结果。

开发者 > 博客

作者：简简单单做算法

发表时间： 2023-10-23 23:45:51

190

0
【MindSpore】【语音识别】DFCNN网络训练loss不收敛

我参考了Model Arts的例子想要用MindSpore也实现语音识别，根据脚本迁移了网络。网络最后是调通了，但是Loss不收敛，训练得到的模型推理结果比预期长了一段。请问有专家可以帮忙看看问题出在哪里吗？

开发者 > 其他

作者： Daniel46010140

1740

3
语音AI小夜灯项目
语音AI小夜灯项目

一、项目简介使用ESP32-S3N8R8模块作为主控芯片，S3内核增加了用于加速神经网络计算和信号处理等的指令，这使得我们可以使用它来快速解析训练好的语音模型进行语音识别的功能。

开发者 > 博客

作者：攻城狮Wayne

发表时间： 2024-01-03 21:08:28

1310

0
语音和语音识别介绍
语音和语音识别介绍

为了增强模型表征能力，获得更好的性能，上述任务可以通过深度神经网络单独训练或者联合训练。语音识别语音识别指的是将语音信号转化为文字序列，是所有基于语音交互的基础。语音识别是语音领域最重要的任务，下面将进行详细介绍。

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-12 07:46:32

373

0
AI语音处理-文字合成语音功能
AI语音处理-文字合成语音功能

前言语音合成技术在生活中用越来越广泛，阅读听书、订单播报、智能硬件、语音导航很多场景下都加入了语音播报功能。语音合成基于深度神经网络技术，提供高度拟人、流畅自然的语音合成服务，可以模拟出不同人的声音，让应用APP、设备开口说话，还能智能化训练个性语音。

开发者 > 其他

作者： DS小龙哥

3072

5
调用语音合成
调用语音合成

可在指定路径里查看保存的音频 result = tts_client.get_tts_response(tts_request) print(json.dumps(result, indent=2, ensure_ascii=False)) if __name__ == '__main

开发者 > 开发服务
新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

两者都需要大量数据用来训练。

开发者 > 博客

作者：黄辣鸡

发表时间： 2021-12-27 07:11:12

4152

0
实时语音识别连续模式
实时语音识别连续模式

vadTail 否 Integer 尾部最大静音时间，[0, 3000]，默认500ms。

开发者 > 开发服务
语音合成WebSocket版
语音合成WebSocket版

具体信息请参见《API参考》中语音合成章节。

开发者 > 开发服务
语音识别与语音控制
语音识别与语音控制

语音控制 SSH连接OriginBot成功后，配置智能语音模块： #从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ .

开发者 > 博客

作者：梦笔生花

发表时间： 2024-10-16 22:01:04

111

0
5分钟玩转AI语音合成
5分钟玩转AI语音合成

在电脑中找到刚下载的文件，打开，就能听到转换后的语音内容了。实验过程到此结束，赶快体验吧，5分钟真的可以实现文本到语音的转换，转换后还是个美女小姐姐的声音哦。

开发者 > 博客

作者：加油O幸福

发表时间： 2022-05-29 13:43:26

1043

0
DeleteDemoInfo 删除语音作业 - API
DeleteDemoInfo 删除语音作业 - API

该API属于VCM服务，描述: 删除语音作业接口URL: "/v2/{project_id}/services/audio-moderation/tasks/{task_id}"

开发者 > 开发工具
语音识别
语音识别

Ø  CTC 传统的语音识别的声学模型训练，对于每一帧的数据，需要知道对应的label才能进行有效的训练，在训练数据之前需要做语音对齐的预处理。而语音对齐的过程本身就需要进行反复多次的迭代，来确保对齐更准确，这本身就是一个比较耗时的工作。

开发者 > 博客

作者： xql

发表时间： 2021-08-25 07:06:17

2180

0
启动实时语音识别
启动实时语音识别

父主题： Android端调用语音交互服务

开发者 > 开发服务

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消