搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

语音情感识别的应用和挑战
语音情感识别的应用和挑战

供支持。情感识别还能应用于许多现实的场景中。情感识别算法具有很高的研究价值。考虑到采集难度、隐私等因素，本文的工作聚焦于使用语音来识别说话人情感的语音情感识别（Speech Emotion Recognition, SER）任务。 2. 语音情感识别技术介绍语音是日常生活中

开发者 > 博客

作者： SSIL_SZT_ZS

发表时间： 2021-08-26 09:02:18

9245

0
【语音识别】基于matlab GUI智能语音识别门禁系统【含Matlab源码 596期】

本文基于Matlab设计实现了一个文本相关的声纹识别系统，可以判定说话人身份。 1 系统原理 a 声纹识别这两年随着人工智能的发展，不少手机App都推出了声纹锁的功能。这里面所采用的主要就是声纹识别相关的技术。声纹识别又叫说话人识别，它和语音识别存在一点差别。 b 梅尔频率倒谱系数（MFCC）

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 20:18:17

335

0
语音识别技术属于什么技术
语音识别技术属于什么技术

一、语音识别技术属于什么技术语音识别技术属于人工智能领域的一个重要分支。语音识别技术，也被称为自动语音识别(Automatic Speech Recognition, ASR)，其主要目标是把人类的语音内容转换为计算机可读的格式，如文本、按键或字符序列。这项技术涉及多个学科，包括

开发者 > 其他

作者： DevFeng

30

1
新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

为了一体。语音识别的问题可以看做是语音到文本的对应关系，语音识别问题大体可以归结为文本基本组成单位的选择上。单位不同，则建模力度也随之改变。图4 语音识别的基本途径根据图中文本基本组成单位从大到小分别是：整句文本，如“Hello World”,对应的语音建模尺度为整条语音。

开发者 > 博客

作者：黄辣鸡

发表时间： 2021-12-27 07:11:12

4152

0
基于语音和手势识别的有声相册

上，还增加了识别动物和识别天气的功能。同时，考虑到在一些场合不方便使用语音控制，我还增加了手势控制的功能，这样既拓展了项目的应用空间，同时也增加了使用者的交互体验。项目设计本项目可以通过深度学习识别到上传的照片中风景、动物或者天气的类别，再根据识别出的类别播放出相应的音乐。

开发者 > 博客

作者： yd_281658259

发表时间： 2023-10-14 17:22:56

139

0
【转载】语音与语音识别介绍
【转载】语音与语音识别介绍

一、语音领域知识介绍音频特征音频数据常见音频任务二、语音识别知识介绍技术历程语音识别的流程声学模型语言模型语音识别的挑战三、音频数据读取与处理

开发者 > 其他

作者： emilyleungbaby

1147

1
【MindSpore易点通】机器学习系列：图片文字识别

当然啦，从一张给定的图片中识别文字肯定比从一份扫描文档中识别文字要复杂的多。操作流程按照我们正常的理解，图片文字识别的话通常会先将图像扫描一遍，然后找出图片中的文字信息，并重点关注这些文字区域，同时对区域中的文字进行识别，当正确读出这些文字以后，将这些文字内容显示并记录下来。听

开发者 > 其他

作者： Skytier

2788

2
什么是语音识别的智能客服？
什么是语音识别的智能客服？

随着人工智能技术的不断发展，语音识别技术越来越成熟，语音技术的应用也越来越广泛。智能客服是其中一个应用领域，它通过语音识别技术，将用户的语音输入转换为文本，并通过自然语言处理技术，解决用户的问题。本文将详细介绍语音识别的智能客服。语音识别的基本原理语音识别是将语音信号转换为文本的技术。

开发者 > 博客

作者： wljslmz

发表时间： 2023-05-11 23:05:12

20

0
语音情感识别之声谱图卷积方法

本文章主体基于PilgrimHui的《论文笔记：语音情感识别（二）声谱图+CRNN》，在原来基础上，补充了数据处理部分以及论文方法的一些细节，欢迎语音情感分析领域的同学一起讨论。 1. An Attention Pooling based Representation Learning

开发者 > 博客

作者： Tython

发表时间： 2020-04-13 15:39:34

10283

1
小白来了解文字识别使用限制之网络图片及智能分类识别

计图等互联网图片。图像各边的像素大小在15到8192px之间。图像中有效文字图片占比超过60%，避免有效文字图片占比过小。支持图像中有效文字图片的任意角度的水平旋转（需开启方向检测）。目前不保证API调用的并发能力，如有大并发需求，请提前联系我们智能分类识别只支持识别PNG、JP

开发者 > 其他

作者：建赟

3406

2
语音识别全链路
语音识别全链路

人类的语音，并给出相应的回应。首先，语音识别是将人类语音转换为机器可读的数字信号。在这个环节，机器会对收集到的语音进行预处理，包括去除噪音、增强语音信号等。然后，通过对语音信号的分析，将语音转换为文本，这是实现语音交互的基础。接下来是语音合成环节。语音合成是将文本转化为语音的过程

开发者 > 其他

作者：运气男孩

32

0
Django REST项目实战：在线中文字符识别

ello World”。 03、前端开发我们拟实现一个在线中文字符识别系统，用户在网页上上传图片，然后通过Ajax技术将图片传输至后台服务器，后台服务器调用中文字符识别算法将图片中的文字识别出来，并以JSON字符串的形式返回结果给前端页面进行显示。整个开发过程分

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-03-27 10:25:18

158

0
ModelArts中文语音识别和语音识别的实战经验

b/blob/master/notebook/DL_speech_recognition/DFCNN和Transformer模型完成中文语音识别.ipynb 做到最后一步，如下图，回复打卡贴截图即可，课程打卡回复链接：https://bbs.huaweicloud.com/forum/forum

开发者 > 其他

作者： QGS

4750

1
Hilens开发语音识别如何调用麦克实现实时语音读取

如题

开发者 > 其他

作者： @w

1529

2
【语音识别】基于matlab MFCC GMM语音识别【含Matlab源码 535期】

四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理（第3版）[M].清华大学出版社，2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社，2019.

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 18:59:49

353

0
语音识别模块的原理
语音识别模块的原理

术的不断进步，语音识别模块在识别准确性、实时性和智能化方面不断提升，为人们的生活和工作带来了极大的便利。同时，语音识别模块也在不断发展和创新。例如，现在的语音识别模块可以采用非特定人识别技术，使得系统能够识别不同人的语音;也可以结合深度神经网络等先进技术，提高识别的准确性和鲁棒性

开发者 > 其他

作者： DevFeng

21

1
【语音识别】基于matlab特定人的语音识别分辨【含Matlab源码 534期】

四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理（第3版）[M].清华大学出版社，2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社，2019.

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 17:47:41

261

0
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

技术可以将一种语言的语音转录为文字，再结合机器翻译技术，实现实时语音翻译。自动客服系统：许多客服系统利用 ASR 实现智能应答，自动处理简单的客户咨询，减轻了人工客服的压力。什么是文本转语音（TTS）？文本转语音（Text To Speech，简称 TTS）是一种将文字转换成语音的技术，

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-25 23:43:30

63

0
自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

技术可以将一种语言的语音转录为文字，再结合机器翻译技术，实现实时语音翻译。自动客服系统：许多客服系统利用 ASR 实现智能应答，自动处理简单的客户咨询，减轻了人工客服的压力。什么是文本转语音（TTS）？文本转语音（Text To Speech，简称 TTS）是一种将文字转换成语音的技术，

开发者 > 博客

作者： kwan的解忧杂货铺

发表时间： 2024-11-16 18:34:56

0

0
华为云-Python：OCR 文字识别-通用表格识别，图片转文字，返回结果输出至Excel

# -*- coding: utf-8 -*-"""新手测试笔记文字识别 OCR：通用表格识别"""from huaweicloudsdkcore.auth.credentials import BasicCredentialsfrom huaweicloudsdkocr.v1.region

开发者 > 其他

作者： yd_253509379

312

0

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音情感识别的应用和挑战

【语音识别】基于matlab GUI智能语音识别门禁系统【含Matlab源码 596期】

语音识别技术属于什么技术

新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

基于语音和手势识别的有声相册

【转载】语音与语音识别介绍

【MindSpore易点通】机器学习系列：图片文字识别

什么是语音识别的智能客服？

语音情感识别之声谱图卷积方法

小白来了解文字识别使用限制之网络图片及智能分类识别

语音识别全链路

Django REST项目实战：在线中文字符识别

ModelArts中文语音识别和语音识别的实战经验

Hilens开发语音识别如何调用麦克实现实时语音读取

【语音识别】基于matlab MFCC GMM语音识别【含Matlab源码 535期】

语音识别模块的原理

【语音识别】基于matlab特定人的语音识别分辨【含Matlab源码 534期】

自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

自动语音识别（ASR）与文本转语音（TTS）技术的应用与发展

华为云-Python：OCR 文字识别-通用表格识别，图片转文字，返回结果输出至Excel

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线