搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

实时语音识别 - 代码示例
实时语音识别 - 代码示例

基于websocket接口对输入的音频流进行识别，实时返回识别结果。

开发者 > 开发工具
实时语音识别 - 代码示例
实时语音识别 - 代码示例

基于websocket接口对输入的音频流进行识别，实时返回识别结果。

开发者 > 开发工具
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

近年来，语音技术在人工智能领域的发展极为迅速，语音识别（ASR）和文本转语音（TTS）作为两项重要的核心技术，被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题，共同助力于实现自然、流畅的人机对话。

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-25 23:43:30

63

0
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

近年来，语音技术在人工智能领域的发展极为迅速，语音识别（ASR）和文本转语音（TTS）作为两项重要的核心技术，被广泛应用于智能助手、客户服务系统、翻译设备以及教育平台等多个领域。这两种技术各自解决了语音交互中的不同问题，共同助力于实现自然、流畅的人机对话。

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-16 18:34:56

0

0
人工智能：语音识别技术介绍
人工智能：语音识别技术介绍

音域参数：傅利叶谱、梅尔频率到谱系数，主要用来提取语音内容以及音色的差别，用来更进一步辨别语音信息。 2、什么是语音识别语音识别简单来说就是把语音内容自动转换为文字的过程，是人与机器交互的一种技术。涉及领域：声学、人工智能、数字信号处理、心理学等方面。

开发者 > 博客

作者： IT技术分享社区

发表时间： 2022-11-29 13:34:33

199

0
【SDC】【语音对讲】web添加语音对讲功能

【功能模块】通过搭建推流服务器(RTSP 转为前端JSMpeg播放)，这个时候遇到问题， SDK可以语音对讲， web类型的是否可以对讲？

开发者 > 其他

作者： sfr

2185

1
【语音加密】基于matlab混沌+AES语音加密解密【含Matlab源码 1593期】

一、混沌语音加密简介语音的数据安全是网络语音通信的重要问题之一,混沌序列由于具有类随机性常被用作加密密钥

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:57:48

273

0
百度语音识别笔记
百度语音识别笔记

除了出色的效果，易用的体验，我们再看看这个项目中还有什么宝藏可以挖掘，果然我们发现项目中还包含丰富的预训练模型，并且语音识别和语音合成均支持自定义训练。

开发者 > 博客

作者：风吹稻花香

发表时间： 2021-12-23 16:56:10

866

0
【语音采集】基于matlab GUI语音信号采集【含Matlab源码 291期】

4.4 语音信号的频域分析语音信号的频域分析就是分析语音信号的频域持征。从广义上讲，语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等，而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 19:43:26

285

0
【CANN训练营】Ascend 910实现LeNet网络的minist手写数据训练

一、环境及准备工作 CPU/GPU复现使用华为云ModelArts-CodeLab平台 Ascend复现使用华为云ModelArts-开发环境-Notebook 原始Lenet代码链接：https://gitee.com/lai-pengfei/LeNet 二、在CPU/GPU

开发者 > 博客

作者： JeffDing

发表时间： 2022-07-07 03:42:51

1068

0
PyTorch分布式训练
PyTorch分布式训练

PyTorch分布式训练 PyTorch 是一个 Python 优先的深度学习框架，能够在强大的 GPU 加速基础上实现张量和动态神经网络。PyTorch的一大优势就是它的动态图计算特性。

开发者 > 博客

作者：风吹稻花香

发表时间： 2021-06-04 15:35:07

1360

0
语音内容标注
语音内容标注

根据播放内容，在下方“语音内容”文本框中填写音频内容。 3. 输入内容后单击下方的“确认标注”按钮完成标注。音频将被自动移动至“已标注”页签。 **图1** 语音内容音频标注 !

开发者 > 其他

作者：运气男孩

428

3
语音识别（ASR）
语音识别（ASR）

需要AI产品经理选择用户预期不苛刻的场景，或者在设计时管理好用户预期。

开发者 > 其他

作者： andyleung

2569

3
【语音合成】基于matlab语音信号变速【含Matlab源码 565期】

按照新的语音时长，对帧数fn插值为fn‘。将ai系数转化称LSF参数，对LSF参数插值。将插值后的LSF系数重构为1-fn’帧线性预测系数ai’。用预测系数ai’和基音参数合成语音。 PS.

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 18:00:14

458

0
人工智能 - 语音识别
人工智能 - 语音识别

第一款消费者听写产品Dragon Dictate于1990年发布，可以根据语音自动键入文字。然后，AT&T公司推出了一种语音识别应用程序，该程序无需人工即可路由呼叫。这些早期的系统或者具有适合特定环境的小型词汇表，需要由单个声音进行大量训练。

开发者 > 其他

作者：斑馬斑馬

439

0
CreateTtsa 创建语音驱动任务 - API

该API属于MetaStudio服务，描述: 该接口用于创建驱动数字人表情、动作及语音的任务。接口URL: "/v1/{project_id}/ttsa-jobs"

开发者 > 开发工具
自动语音识别ASR
自动语音识别ASR

语言模型训练（Language Model Training）：语言模型用于估计某个词出现的概率。语言模型通常也由基于深度学习的神经网络实现，但它们更多关注的是语言的结构和语法，而非具体的声学特征。

开发者 > 其他

作者：运气男孩

70

0
零代码基础建立AI语音模型-快速上手

第四步，标注，选择图片，右侧标签名上“如下图”，点击确定即可，如果数据还太少，可以自己添加数据，再点击同步数据源即可第五步，标注完全后，点击开始训练耐心等待训练结束即可训练完成后点击部署，有免费CPU和增强型，一个免费一个收费，收费的算力很好点击提交即可，耐心等待部署时间大致

开发者 > 博客

作者： QGS

发表时间： 2021-02-06 17:08:52

4324

0
[python]基于faster whisper实时语音识别语音转文本

介绍： Faster-Whisper是一个基于OpenAI的Whisper模型的高效实现。它利用CTranslate2，一个专为Transformer模型设计的快速推理引擎，优化了内存使用效率。

开发者 > 博客

作者： futureflsl

发表时间： 2023-12-31 20:51:28

2

0
语音情感识别的应用和挑战
语音情感识别的应用和挑战

在人工智能（AI）产品和人的交互过程中，如果能够准确地把握人当前的情感状态，根据情感状态做出回应，可以极大地提升用户对AI产品的体验。这在商品推荐，舆论监控，人机对话等方面都有着重要的意义。

开发者 > 博客

作者： SSIL_SZT_ZS

发表时间： 2021-08-26 09:02:18

9245

0

总条数： 10000

上一页
1
...
4
5
6
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消