搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

android
android

public void onCreate() { Log.d("MyApplication", getProcessName(android.os.Process.myPid())); super.onCreate(); } /** * 根据进程

开发者 > 其他

作者：泽宇-Li

1040

1
如何从视频中分离音频进行语音识别

m4a文件，然后使用该文件就可以调用SIS的语音识别接口进行语音识别4、使用分离后的音频进行语音识别因为音频时长超过一分钟，所以使用录音文件识别进行识别，音频的采用率44.1k hz，使用录音文件时会自动降采用到8k或者16k。如下，若现在chinese_16k_conversation模

开发者 > 其他

作者： void0

3330

0
android
android

级View，一般情况下它内部包含一个竖直方向的LinearLayout，在这个LinearLayout里面有上下两个部分（具体情况和Android版本及主体有关），上面的是标题栏，下面的是内容栏。在Activity中通过setContentView所设置的布局文件其实就是被加到内

开发者 > 其他

作者：泽宇-Li

846

3
语音识别在金融行业的应用案例

  return audio``` **2. 语音识别模型训练** 训练语音识别模型可以使用深度学习技术，如端到端的语音识别模型。这需要大量标注好的语音数据和对应的文本标签。 ```python# 代码示例 - 端到端语音识别模型训练import tensorflow as tffrom

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:35:10

1

0
【语音识别】基于matlab男女声识别【含Matlab源码 452期】

（2）隐马尔可夫法(HMM) 隐马尔可夫法(HMM) 是70年代引入语音识别理论的，它的出现使得自然语音识别系统取得了实质性的突破。HMM 方法现已成为语音识别的主流技术，目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 19:33:32

345

0
Android开发基础
Android开发基础

课程包含Android基础知识、Activity、UI、线程间通信、数据存储基础等丰富的移动端应用开发理论基础知识。

开发者 > 开发者学堂
Python智能语音识别语翻译平台｜项目后端搭建

shlib、pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。 Python程序设计基础，第三方库Django、requests、hashlib、pyttsx3等的使用，百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。

开发者 > 博客

作者： TiAmoZhang

发表时间： 2023-12-06 00:05:22

149

0
kaldi语音识别 chain模型的训练流程

0.解析配置文件调用steps/nnet3/xconfig_to_configs.py函数生成final.config。如果配置文件中有指定affine-transform-file=$dir/configs/idct.mat。则也会在解析过程中生成该文件。生成idct.ma

开发者 > 博客

作者： ASR-beginer

发表时间： 2020-07-02 11:13:10

8475

1
kaldi语音识别 chain模型的数据准备

egs的可视化：在介绍chain模型的数据准备过程之前，我们先来看一下所生成egs的具体内容： nnet3-chain-copy-egs ark:train.cegs ark,t:text.cegs 通过以上指令可将chain模型生成的egs由二进制文件转化成文本文件。具体形式如下图所示：

开发者 > 博客

作者： ASR-beginer

发表时间： 2020-07-02 11:00:32

11793

0
通俗易懂说AI--语音识别篇
通俗易懂说AI--语音识别篇

今天我们要浅谈一下一项令人着迷的技术——语音识别。你有没有想过，为什么语音助手可以听懂你说的话？为什么你可以通过语音搜索来获取信息？让我们一起揭开语音识别技术的神秘面纱，看看它是如何让计算机听懂我们的声音的。1. 语音识别的基本原理语音识别的原理复杂而神奇。首先，计算机不会像我们

开发者 > 其他

作者：运气男孩

59

2
基于语音识别的人机交互设计
基于语音识别的人机交互设计

项目介绍基于语音识别的人机交互设计项目通常涉及两个主要方面：语音识别引擎的集成和相应应用的开发。首先，选择合适的语音识别引擎，然后设计并开发应用，实现用户通过语音与系统进行交互。技术原理语音识别引擎选择一款成熟的语音识别引擎是关键的一步。Google的Speech-to-Text

开发者 > 博客

作者： Y-StarryDreamer

发表时间： 2024-01-31 22:37:57

3

0
LF-MMI在语音识别中的应用
LF-MMI在语音识别中的应用

training of deep neural networks中，被引入做语音识别深度模型训练。在Interspeech 2016的论文Purely sequence-trained neural networks for ASR based on lattice-free MMI中，发展为

开发者 > 其他

作者： void0

3590

0
DFCNN + Transformer模型完成中文语音识别（三）

for i in v: text.append(num2word[i]) return v, text 使用搭建好的语音识别系统进行测试在这里显示出10条语音示例的原文拼音及识别结果、原文汉字及识别结果。 for i in range(10): print('\n示例'

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:41:11

315

0
定制语音识别的应用场景
定制语音识别的应用场景

定制语音识别的应用场景应用场景详细描述语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短信转文字，提

开发者 > 其他

作者：极客潇

1647

1
【人工智能相关知识分享】语音识别语言模型

语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律，其中N-Gram简单有效，被广泛使用。N-Gram：该模型基于这样一种假设，第n个词的出现只与前面N-1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。这些概

开发者 > 其他

作者：某地瓜

936

1
【人工智能相关知识分享】语音识别声学特征

LPC 线性预测分析从人的发声机理入手，通过对声道的短管级联模型的研究，认为系统的传递函数符合全极点数字滤波器的形式，从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS，即可得到线性预测系数LPC。对 LPC的

开发者 > 其他

作者：某地瓜

1852

1
【MindSpore】【语音识别】DFCNN网络训练loss不收敛

Arts的例子想要用MindSpore也实现语音识别，根据脚本迁移了网络。网络最后是调通了，但是Loss不收敛，训练得到的模型推理结果比预期长了一段。请问有专家可以帮忙看看问题出在哪里吗？附加一些说明，也许可以更好解决我遇到的问题Model Arts上，是用两个网络组合完成语音识别的任务的：DFCNN+

开发者 > 其他

作者： Daniel46010140

1740

3
用麦克风实现实时语音识别
用麦克风实现实时语音识别

请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如音频是pcm格式，并且采样率为8k，则格式填写pcm8k16bit。如果返回audio_format is invalid 说明该文件格式不支持。具体支持哪些音频格式，需要参考一些api文档。

开发者 > 其他

作者： yd_217514920

185

4
DFCNN + Transformer模型完成中文语音识别（二）

7.声学模型训练准备训练参数及数据为了本示例演示效果，参数batch_size在此仅设置为1，参数data_length在此仅设置为20。若进行完整训练，则应注释data_args.data_length = 20，并调高batch_size。 def data_hparams():

开发者 > 博客

作者： HWCloudAI

发表时间： 2022-12-19 03:40:17

312

0
华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00（北京时间）停售通知

00:00（北京时间）正式停售 “语音交互服务-语音识别-长语音识别”。华为云在此提醒您，产品停售后，该长语音识别接口将不可被调用。如果您需要继续使用长语音识别功能，请您在2019/10/24 00:00之前适配录音文件识别接口，即“语音交互服务-定制语音识别-录音文件识别”的接口。更多关于“

开发者 > 博客

作者：华为云客户服务中心

发表时间： 2019-10-08 15:20:57

6059

0

总条数： 10000

上一页
1
...
6
7
8
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

android

如何从视频中分离音频进行语音识别

android

语音识别在金融行业的应用案例

【语音识别】基于matlab男女声识别【含Matlab源码 452期】

Android开发基础

Python智能语音识别语翻译平台｜项目后端搭建

kaldi语音识别 chain模型的训练流程

kaldi语音识别 chain模型的数据准备

通俗易懂说AI--语音识别篇

基于语音识别的人机交互设计

LF-MMI在语音识别中的应用

DFCNN + Transformer模型完成中文语音识别（三）

定制语音识别的应用场景

【人工智能相关知识分享】语音识别语言模型

【人工智能相关知识分享】语音识别声学特征

【MindSpore】【语音识别】DFCNN网络训练loss不收敛

用麦克风实现实时语音识别

DFCNN + Transformer模型完成中文语音识别（二）

华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00（北京时间）停售通知

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线