搜索_华为云

已找到以下 10000 条记录

语音翻译_语音识别_语音合成
语音翻译_语音识别_语音合成

【语音翻译语音合成语音识别语音播报】语音翻译API用于识别短语音（60秒）并翻译为指定语言的文本，接口集成语音识别、文本翻译、语音合成技术能力，支持四十多种语音的语音识别和翻译，可将翻译结果转换为语音播报。 —— 我们只做精品！

云商店

商家: 杭州安那其科技有限公司

交付方式: API
浅浅了解语音识别技术框架
浅浅了解语音识别技术框架

汉语加上语气词共有412个音节，包括轻音字，共有1282个有调音节字，所以当在小词汇表孤立词语音识别时常选用词作为基元，在大词汇表语音识别时常采用音节或声韵母建模，而在连续语音识别时，由于协同发音的影响，常采用声韵母建模。

开发者 > 其他

作者： QGS

47

1
语音识别的应用场景
语音识别的应用场景

人机交互通过语音唤醒、语音识别服务，对终端设备发送语音命令，对设备进行实时操作，提升人机交互体验。

开发者 > 其他

作者：极客潇

1555

1
新建离线处理集成作业 - 数据治理中心 DataArts Studio

新建离线处理集成作业约束限制离线处理集成作业不支持在企业模式下运行。离线处理集成作业功能当前需申请白名单后才能使用。如需使用该特性，请联系客服或技术支持人员。操作步骤参考访问DataArts Studio实例控制台，登录DataArts Studio管理控制台。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
离线作业 - 推荐系统 RES
离线作业 - 推荐系统 RES

离线作业离线作业简介组合作业数据质量特征工程召回策略排序策略过滤规则效果评估管理离线作业删除离线作业父主题：用户指南（旧版）

帮助中心 > 推荐系统 RES > 用户指南 > 用户指南（旧版）
语音识别识别结果非常差解决思路

Ⅰ　　调用语音识别接口，识别结果同真实结果差别很大，或者服务端报音频格式错误。Ⅱ　　解决方案如下Ⅲ　　检查音频采样率是否符合。Ⅳ　　对于裸音频，可采用toolsoft Audio player等工具进行试听，通过设置不同的采样率，播放正常的即为音频正常采样率。

开发者 > 其他

作者：我就是豆豆

460

0
离线作业概述 - 数据治理中心 DataArts Studio

离线作业概述离线处理集成作业作为数据开发的一个作业类型，支持跨集群下发数据迁移作业，实现常用的批作业迁移能力。

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业）
通用表格识别 - 文字识别 OCR
通用表格识别 - 文字识别 OCR

通用表格识别功能介绍识别表格图片中的文字内容，并将识别的结果以JSON格式返回给用户。返回结果将图片区域（words_region）划分为两类：纯文本区（text）和表格区（table），并返回表格结构（row, column）和文本信息。该接口的使用限制请参见约束与限制，详细使用指导请参见

 帮助中心 > 文字识别 OCR > API参考 > API
DFCNN + Transformer模型完成中文语音识别（一）

DFCNN + Transformer模型完成中文语音识别语音识别，通常称为自动语音识别，（Automatic Speech Recognition，ASR），主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的文本内容，也有可能是二进制编码或者字符序列。

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:37:26

559

0
语音识别中的语言模型：连接语音与文本

语音识别中的语言模型实现 A. 数据准备与预处理语音数据采集：收集语音数据集，并进行标注。数据集应包括音频文件和对应的文本转录。特征提取：从音频文件中提取特征，如MFCCs。

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-08-10 12:51:30

107

0
端到端语音识别的发展趋势
端到端语音识别的发展趋势

端到端语音识别模型训练训练端到端语音识别模型需要使用带有文本标注的音频数据，常使用CTC作为损失函数。

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:32:37

5

0
语音识别在社交媒体分析中的应用

get_social_media_audio(api_endpoint, audio_id): response = requests.get(api_endpoint + f"/audio/{audio_id}") audio_data = response.content # 转换音频格式

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:43:14

3

0
语音识别在无障碍技术中的角色

数据准备与预处理在项目中，我们需要音频数据和地图数据。音频数据需要进行预处理，包括音频格式的转换、噪声去除等操作。地图数据需要进行整合，确保系统能够获取准确的导航信息。

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:30:13

0

0
【语音识别】基于matlab GUI语音识别信号灯图像模拟控制（带面板）【含Matlab源码 757期】

选择合理的信号特征参数是语音识别的一个关键因素。为了提高对语音信号进行分析、处理的效率，需要提取特征参数，消除与语音识别无关的冗余信息，保留影响语音识别的重要信息，同时对语音信号进行压缩。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 17:40:56

364

0
浅谈实时语音识别应用场景_公安

实时语音识别技术中的离线转写功能能够将民警外出办案记录的录音文件或视频文件转写成文字，满足多文档同步识别转写，转写速度快的功能。民警不用跟着录音边听边整理，提高笔录整理的效率。应用在快速记录询问笔录，可根据公安办案业务流程和工作习惯，中增加法律条款的查询等。

开发者 > 其他

作者： QGS

22

2
语音识别在教育技术中的创新
语音识别在教育技术中的创新

数据准备与预处理在语音识别项目中，我们需要大量带有标注的语音数据。这些数据可能包括标准发音示例、口音数据等。预处理阶段需要对音频数据进行分帧、提取梅尔频谱等操作。

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:29:05

1

0
LF-MMI在语音识别中的应用
LF-MMI在语音识别中的应用

参考资料：1. https://zhuanlan.zhihu.com/p/113715935语音识别系列之区分性训练和LF-MMI, 张彬彬2. http://placebokkk.github.io/asr/2019/12/24/asr-paper-se-mmi-note.html

开发者 > 博客

作者：作家小然

发表时间： 2020-07-14 16:50:15

9661

1
Python 教你如何用几行代码实现文本语音识别

未来展望随着人工智能和自然语言处理技术的发展，语音识别的准确性和效率将继续提升。在未来，离线识别、多语言支持以及个性化模型定制将变得更加普及，为更多行业带来创新机会。同时，隐私保护和数据安全也将成为重要的研究方向。

开发者 > 博客

作者：红尘灯塔

发表时间： 2025-02-19 09:33:30

0

0
ModelArts搭建中文语音识别系统【转载】

除了传统语音识别技术之外，基于深度学习的语音识别技术也逐渐发展起来。自动语音识别（Automatic Speech Recognition，ASR），也可以简称为语音识别。

开发者 > 其他

作者：浩泽学编程

684

4
语音识别准确率不高，如何提高？

你好，我试用了一下语音识别的功能，发现语音识别准确率不高，如何提高呢？我的语音里有些专业词语识别得不好。还有，我想知道这个语音识别的功能支持区分角色嘛？

开发者 > 其他

作者：白马过平川

4260

2

总条数： 10000

上一页
1
...
11
12
13
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语音翻译_语音识别_语音合成

浅浅了解语音识别技术框架

语音识别的应用场景

新建离线处理集成作业 - 数据治理中心 DataArts Studio

离线作业 - 推荐系统 RES

语音识别识别结果非常差解决思路

离线作业概述 - 数据治理中心 DataArts Studio

通用表格识别 - 文字识别 OCR

DFCNN + Transformer模型完成中文语音识别（一）

语音识别中的语言模型：连接语音与文本

端到端语音识别的发展趋势

语音识别在社交媒体分析中的应用

语音识别在无障碍技术中的角色

【语音识别】基于matlab GUI语音识别信号灯图像模拟控制（带面板）【含Matlab源码 757期】

浅谈实时语音识别应用场景_公安

语音识别在教育技术中的创新

LF-MMI在语音识别中的应用

Python 教你如何用几行代码实现文本语音识别

ModelArts搭建中文语音识别系统【转载】

语音识别准确率不高，如何提高？

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线