搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

DFCNN + Transformer模型完成中文语音识别（三）

for i in v: text.append(num2word[i]) return v, text 使用搭建好的语音识别系统进行测试在这里显示出10条语音示例的原文拼音及识别结果、原文汉字及识别结果。 for i in range(10): print('\n示例'

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:41:11

315

0
多语言语音识别挑战与解决方案

**引言** 多语言语音识别是语音技术领域中的一个重要挑战。随着全球化的发展，不同语种之间的语音识别需求逐渐增加。本文将深入研究多语言语音识别所面临的挑战，并提出相应的解决方案。通过项目实例，我们将详细探讨挑战的性质以及采用的技术手段。 **项目介绍** 我们选择了一个涉及多国

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:27:58

1

0
噪声环境下的语音识别挑战与解决方案

引言在现实生活中，语音识别系统经常面临噪声环境的挑战，例如街头嘈杂声、办公室背景声等。这些噪声会降低语音识别系统的性能，因此在噪声环境中实现准确的语音识别是一个重要而具有挑战性的任务。本文将深入研究噪声环境下的语音识别挑战，并提出相应的解决方案，结合实例进行详细讲解。项目介绍

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:36:43

0

0
【人工智能相关知识分享】语音识别声学特征

LPC 线性预测分析从人的发声机理入手，通过对声道的短管级联模型的研究，认为系统的传递函数符合全极点数字滤波器的形式，从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS，即可得到线性预测系数LPC。对 LPC的

开发者 > 其他

作者：某地瓜

1852

1
【人工智能相关知识分享】语音识别语言模型

语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律，其中N-Gram简单有效，被广泛使用。N-Gram：该模型基于这样一种假设，第n个词的出现只与前面N-1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。这些概

开发者 > 其他

作者：某地瓜

936

1
基于React-Native0.55.4的语音识别项目全栈方案

览器和Android6.0(API23)自带的浏览器，Android8.0(API26)自带的浏览器,结果是都不支持。二. 方案调研和新的坑o(￣▽￣)d 既然从移动端直接访问Web应用时无法调起录音接口，至少是无法兼容很多系统和机型，如果不考虑直接原生开发Android的话，只有寄希望于Hybrid的方案了。2

开发者 > 博客

作者：大史不说话

发表时间： 2018-10-22 14:34:41

8736

0
语音识别技术之说话人自适应技术

adaptation》这篇文章来自爱丁堡大学，以下是摘要：通过调整声学模型来补偿训练和测试条件之间的不匹配，例如通过适应看不见的说话人，可以改善ASR的识别性能。说话人自适应方法的成功依赖于选择适合于自适应的权重并使用良好的自适应策略来更新这些权重以便不过拟合自适应数据。在本文中，我

开发者 > 其他

作者：可爱又积极

1047

2
华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00（北京时间）停售通知

00:00（北京时间）正式停售 “语音交互服务-语音识别-长语音识别”。华为云在此提醒您，产品停售后，该长语音识别接口将不可被调用。如果您需要继续使用长语音识别功能，请您在2019/10/24 00:00之前适配录音文件识别接口，即“语音交互服务-定制语音识别-录音文件识别”的接口。更多关于“

开发者 > 博客

作者：华为云客户服务中心

发表时间： 2019-10-08 15:20:57

6059

0
[python]基于faster whisper实时语音识别语音转文本

Faster-Whisper项目包括一个web网页版本和一个命令行版本，同时项目内部已经整合了VAD算法。VAD是一种音频活动检测的算法，可以准确的把音频中的每一句话分离开来，让whisper更精准的定位语音开始和结束的位置。 faster whisper地址： https://github

开发者 > 博客

作者： futureflsl

发表时间： 2023-12-31 20:51:28

2

0
构建智能语音识别应用：自定义模型和实时识别

处理识别结果（例如：输出识别结果、执行相应操作等）这段代码创建了一个音频输入流，读取麦克风输入的音频数据，并使用训练好的模型进行实时识别。您可以根据实际需求对音频数据进行预处理和后处理。结论在本文中，我们探讨了如何构建智能语音识别应用程序，重点介绍了自定义模型的训练和实时识别的实现。通

开发者 > 博客

作者：皮牙子抓饭

发表时间： 2023-06-08 08:59:35

20

1
新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

语音识别技术的发展已有数十年发展历史，大体来看可以分成传统的识别的方法和基于深度学习网络的端到端的方法。无论哪种方法，都会遵循“输入-编码-解码-输出”的过程。图1 语音识别过程编码过程：语音识别的输入是声音，属于计算机无法直接处理的信号，所以需要编码过程将其转变为数字信

开发者 > 博客

作者：黄辣鸡

发表时间： 2021-12-27 07:11:12

4152

0
Python智能语音识别语翻译平台｜项目前端搭建

HTML，JavaScript等技术的应用。 01、任务实现步骤任务描述：本任务利用HTML和JavaScript等搭建智能语音识别与翻译平台的前端页面，包括index.htm、base.htm前端网页模板的编写以及错误页面404.htm的编写。第一步：编写base

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-12-06 00:04:44

8

0
android（3）
android（3）

静态注册：在AndroidManifest.xml中注册广播(称为静态注册) <receiver android:name=".MyReceiver"> <intent-filter> <action android:name="com.anjoyo.receiver"/> </intent-filter>

开发者 > 其他

作者：泽宇-Li

833

3
【问答官】ModelArts的语音识别技术优势在哪里？

【问答官】ModelArts的语音识别技术优势在哪里？

开发者 > 其他

作者： zhengy1347049

1149

4
android(1)
android(1)

Layout 现在一般不用了;RelativeLayout ：android:layout_toRightOf="@id/tel_label" //表示在tel_label的右边，用 id 来做相对布局android:layout_below="@id/content" //表示

开发者 > 其他

作者：泽宇-Li

1134

4
行业前沿技术对语音识别的影响

引言语音识别技术在过去几年取得了巨大的发展，但随着行业前沿技术的不断涌现，语音识别领域也在不断演进。本文将深入探讨行业前沿技术对语音识别的影响，包括技术原理、实际项目部署过程、示例应用，以及未来的发展方向。项目介绍语音识别作为自然语言处理的一个重要分支，受益于深度学习、自然

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:44:43

7

0
Android转型
Android转型

开发了很长时间的Android,但是最近想转型，不知道是转前端还是转java后端

开发者 > 其他

作者：浮生闲半日

3165

10
Ubuntu20.04 使用Python实现全过程离线语音识别（包含语音唤醒，语音转文字，指令识别，文字转语音）-转载

torchaudio def voice_into_word(): asr_model = EncoderDecoderASR.from_hparams(source="speechbrain/asr-transformer-aishell",

开发者 > 其他

作者：泽宇-Li

304

2
AI学习记（语音识别）-第二集
AI学习记（语音识别）-第二集

语音识别技术；“理解”需要自然语言处理技术；“回答”需要语音合成技术，三个步骤环环相扣，相辅相成。语音识别技术时对话交互的开端，时保证对话交互高效准确进行的基础。语音识别技术子20世纪50年代开始步入萌芽阶段，发展至今，主流算法模型已经经历了四个阶段，包括模板匹配

开发者 > 其他

作者： @Wu

1851

4
【入驻式求助】语音识别后调用动态库异常

函数，日志显示能获取正常的语音识别结果，也能成功调用动态库的函数，结果正常。当我修改第 31 行为 <goto next="#test1"/>，即获取语音识别结果后去调用动态库的另一个函数 TISC_QueryKey，此时会出现获取不到语音识别结果，而且日志也卡死了，也没有看到任何

开发者 > 其他

作者：凡小枫

2754

8

总条数： 10000

上一页
1
...
7
8
9
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DFCNN + Transformer模型完成中文语音识别（三）

多语言语音识别挑战与解决方案

噪声环境下的语音识别挑战与解决方案

【人工智能相关知识分享】语音识别声学特征

【人工智能相关知识分享】语音识别语言模型

基于React-Native0.55.4的语音识别项目全栈方案

语音识别技术之说话人自适应技术

华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00（北京时间）停售通知

[python]基于faster whisper实时语音识别语音转文本

构建智能语音识别应用：自定义模型和实时识别

新手语音入门（三）：语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

Python智能语音识别语翻译平台｜项目前端搭建

android（3）

【问答官】ModelArts的语音识别技术优势在哪里？

android(1)

行业前沿技术对语音识别的影响

Android转型

Ubuntu20.04 使用Python实现全过程离线语音识别（包含语音唤醒，语音转文字，指令识别，文字转语音）-转载

AI学习记（语音识别）-第二集

【入驻式求助】语音识别后调用动态库异常

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线