内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • android

    public void onCreate() {        Log.d("MyApplication", getProcessName(android.os.Process.myPid()));        super.onCreate();    }    /**     * 根据进程

    作者: 泽宇-Li
    1040
    1
  • 如何从视频中分离音频进行语音识别

    m4a文件,然后使用该文件就可以调用SIS的语音识别接口进行语音识别4、使用分离后的音频进行语音识别 因为音频时长超过一分钟,所以使用录音文件识别进行识别,音频的采用率44.1k hz,使用录音文件时会自动降采用到8k或者16k。如下,若现在chinese_16k_conversation模

    作者: void0
    3330
    0
  • android

    级View,一般情况下它内部包含一个竖直方向的LinearLayout,在这个LinearLayout里面有上下两个部分(具体情况和Android版本及主体有关),上面的是标题栏,下面的是内容栏。在Activity中通过setContentView所设置的布局文件其实就是被加到内

    作者: 泽宇-Li
    846
    3
  • 语音识别在金融行业的应用案例

      return audio``` **2. 语音识别模型训练** 训练语音识别模型可以使用深度学习技术,如端到端的语音识别模型。这需要大量标注好的语音数据和对应的文本标签。 ```python# 代码示例 - 端到端语音识别模型训练import tensorflow as tffrom

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:35:10
    1
    0
  • 语音识别】基于matlab男女声识别【含Matlab源码 452期】

    (2)隐马尔可夫法(HMM) 隐马尔可夫法(HMM) 是70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。HMM 方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计

    作者: 海神之光
    发表时间: 2022-05-28 19:33:32
    345
    0
  • Android开发基础

    课程包含Android基础知识、Activity、UI、线程间通信、数据存储基础等丰富的移动端应用开发理论基础知识。

  • Python智能语音识别语翻译平台|项目后端搭建

    shlib、pyttsx3等的使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。 Python程序设计基础,第三方库Django、requests、hashlib、pyttsx3等的使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。

    作者: TiAmoZhang
    发表时间: 2023-12-06 00:05:22
    149
    0
  • kaldi语音识别 chain模型的训练流程

    0.解析配置文件 调用steps/nnet3/xconfig_to_configs.py函数生成final.config。如果配置文件中有指定affine-transform-file=$dir/configs/idct.mat。则也会在解析过程中生成该文件。 生成idct.ma

    作者: ASR-beginer
    发表时间: 2020-07-02 11:13:10
    8475
    1
  • kaldi语音识别 chain模型的数据准备

    egs的可视化: 在介绍chain模型的数据准备过程之前,我们先来看一下所生成egs的具体内容: nnet3-chain-copy-egs ark:train.cegs ark,t:text.cegs 通过以上指令可将chain模型生成的egs由二进制文件转化成文本文件。具体形式如下图所示:

    作者: ASR-beginer
    发表时间: 2020-07-02 11:00:32
    11793
    0
  • 通俗易懂说AI--语音识别

    今天我们要浅谈一下一项令人着迷的技术——语音识别。你有没有想过,为什么语音助手可以听懂你说的话?为什么你可以通过语音搜索来获取信息?让我们一起揭开语音识别技术的神秘面纱,看看它是如何让计算机听懂我们的声音的。1. 语音识别的基本原理语音识别的原理复杂而神奇。首先,计算机不会像我们

    作者: 运气男孩
    59
    2
  • 基于语音识别的人机交互设计

    项目介绍 基于语音识别的人机交互设计项目通常涉及两个主要方面:语音识别引擎的集成和相应应用的开发。首先,选择合适的语音识别引擎,然后设计并开发应用,实现用户通过语音与系统进行交互。 技术原理 语音识别引擎 选择一款成熟的语音识别引擎是关键的一步。Google的Speech-to-Text

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:37:57
    3
    0
  • LF-MMI在语音识别中的应用

    training of deep neural networks中,被引入做语音识别深度模型训练。在Interspeech 2016的论文Purely sequence-trained neural networks for ASR based on lattice-free MMI中,发展为

    作者: void0
    3590
    0
  • DFCNN + Transformer模型完成中文语音识别(三)

    for i in v: text.append(num2word[i]) return v, text 使用搭建好的语音识别系统进行测试 在这里显示出10条语音示例的原文拼音及识别结果、原文汉字及识别结果。 for i in range(10): print('\n示例'

    作者: HWCloudAI
    发表时间: 2022-12-19 03:41:11
    315
    0
  • 定制语音识别的应用场景

    定制语音识别的应用场景应用场景详细描述语音客服质检识别客服、客户的语音,转换为文本。进一步通过文本检索,检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件,进行快速的识别,转化成文字,方便进行会议记录。语音短消息通过语音发送或者接收短消息时,将音频短信转文字,提

    作者: 极客潇
    1647
    1
  • 【人工智能相关知识分享】语音识别语言模型

    语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概

    作者: 某地瓜
    936
    1
  • 【人工智能相关知识分享】语音识别声学特征

    LPC 线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对 LPC的

    作者: 某地瓜
    1852
    1
  • 【MindSpore】【语音识别】DFCNN网络训练loss不收敛

    Arts的例子想要用MindSpore也实现语音识别,根据脚本迁移了网络。网络最后是调通了,但是Loss不收敛,训练得到的模型推理结果比预期长了一段。请问有专家可以帮忙看看问题出在哪里吗?附加一些说明,也许可以更好解决我遇到的问题Model Arts上,是用两个网络组合完成语音识别的任务的:DFCNN+

    作者: Daniel46010140
    1740
    3
  • 用麦克风实现实时语音识别

    请正确填写音频格式和模型属性字符串 1. 音频格式一定要相匹配. 例如音频是pcm格式,并且采样率为8k,则格式填写pcm8k16bit。 如果返回audio_format is invalid 说明该文件格式不支持。具体支持哪些音频格式,需要参考一些api文档。

    作者: yd_217514920
    185
    4
  • DFCNN + Transformer模型完成中文语音识别(二)

    7.声学模型训练 准备训练参数及数据 为了本示例演示效果,参数batch_size在此仅设置为1,参数data_length在此仅设置为20。 若进行完整训练,则应注释data_args.data_length = 20,并调高batch_size。 def data_hparams():

    作者: HWCloudAI
    发表时间: 2022-12-19 03:40:17
    312
    0
  • 华为云语音交互服务-语音识别-长语音识别于2019年10月24日00:00(北京时间)停售通知

    00:00(北京时间)正式停售 “语音交互服务-语音识别-长语音识别”。华为云在此提醒您,产品停售后,该长语音识别接口将不可被调用。如果您需要继续使用长语音识别功能,请您在2019/10/24 00:00之前适配录音文件识别接口,即“语音交互服务-定制语音识别-录音文件识别”的接口。更多关于“

    作者: 华为云客户服务中心
    发表时间: 2019-10-08 15:20:57
    6059
    0