已找到以下 10000 条记录
  • LF-MMI在语音识别中的应用

    参考资料:1. https://zhuanlan.zhihu.com/p/113715935语音识别系列之区分性训练和LF-MMI, 张彬彬2. http://placebokkk.github.io/asr/2019/12/24/asr-paper-se-mmi-note.html

    作者: 作家小然
    发表时间: 2020-07-14 16:50:15
    9661
    1
  • 语音识别准确率不高,如何提高?

    你好,我试用了一下语音识别的功能,发现语音识别准确率不高,如何提高呢?我的语音里有些专业词语识别得不好。还有,我想知道这个语音识别的功能支持区分角色嘛?

    作者: 白马过平川
    4260
    2
  • 【入驻式求助】语音识别问题

    【问题简要】对于客户短语音,误识别为用户静音,如客户说【对】,被识别为用户静音【问题类别】vxml2.0 【IPCC解决方案版本】IPCC V200R001C80【问题现象描述】正常声音说话,对于短语音识别,如客户说【对】【是】等等一两个字时,有比较大的概率会被识别为静音异常为noinput

    作者: yy2019
    2346
    1
  • 在小藤上实现WeNet自动语音识别

    代码仓地址:https://gitee.com/ascend/ascend_community_projects/tree/310B/SpeechRecognition 登录开发板: cd ${HOME}/ascend_community_projects/SpeechRecognition

    作者: 张辉
    发表时间: 2023-09-01 07:38:30
    54
    0
  • 配置离线处理集成作业 - 数据治理中心 DataArts Studio

    父主题: 数据集成(离线作业)

  • 语音识别系统的组成部分

    语音识别系统的五个主要组成部分:前端声学处理(Preprocessing)前端声学处理是语音识别流程的第一步,它负责捕获和初步处理来自麦克风等传感器的原始语音信号。这部分通常包括以下几个子步骤:声音采集:收集环境中的语音信号。

    作者: DevFeng
    32
    1
  • 语音识别端到端模型解读(一)

    一、概述在很长一段时间内,语音识别领域最常用的模型是GMM-HMM。但近年来随着深度学习的发展,出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中,RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。用得最多的RNN模型包括LSTM、GRU等。

    作者: void0
    4805
    2
  • 离线开发插件 - 设备接入 IoTDA

    2023年8月1日后新用户不再提供离线插件功能。 由于插件离线开发较为复杂,且耗时比较长,我们推荐图形化开发。 开发环境准备 前往官网下载Eclipse安装包,直接解压缩到本地即可使用。 前往官网下载Maven插件包(zip格式),直接解压缩到本地。

  • 离线转写回调接口 - 云客服

    离线转写回调接口 场景描述 智能助手平台提供接口给第三方接入方调用,实现asr离线转写结果回传给ODFS。 该接口是系统级的第三方接口,鉴权方式请参考C3 智能助手平台接口鉴权方式中的说明下的第三点。

  • 查询PerfTest任务离线报告列表 - 性能测试 CodeArts PerfTest

    查询PerfTest任务离线报告列表 功能介绍 查询PerfTest任务离线报告列表 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

  • 【人工智能相关知识分享】语音识别的搜索

    Viterbi算法在不丧失最优解的条件下,同时解决了连续语音识别中HMM模型状态序列与声学观察序列的非线性时间对准、词边界检测和词的识别,从而使这一算法成为语音识别搜索的基本策略。 由于语音识别对当前时间点之后的情况无法预测,基于目标函数的启发式剪枝难以应用。

    作者: 某地瓜
    1446
    3
  • 如何从视频中分离音频进行语音识别

    如下命令会生成sasr.m4a文件,然后使用该文件就可以调用SIS的语音识别接口进行语音识别4、使用分离后的音频进行语音识别 因为音频时长超过一分钟,所以使用录音文件识别进行识别,音频的采用率44.1k hz,使用录音文件时会自动降采用到8k或者16k。

    作者: void0
    3330
    0
  • 语音识别在金融行业的应用案例

    数据准备与预处理** 在金融语音识别项目中,首先需要大量带有标注的语音数据。数据预处理包括音频格式转换、噪音去除等操作。

    作者: Y-StarryDreamer
    发表时间: 2024-01-31 22:35:10
    1
    0
  • Python智能语音识别语翻译平台|项目后端搭建

    Python程序设计基础,第三方库Django、requests、hashlib、pyttsx3等的使用,百度API语音识别业务接口、文本朗读业务接口、翻译业务接口的传入。

    作者: TiAmoZhang
    发表时间: 2023-12-06 00:05:22
    149
    0
  • kaldi语音识别 chain模型的训练流程

    0.解析配置文件 调用steps/nnet3/xconfig_to_configs.py函数生成final.config。如果配置文件中有指定affine-transform-file=$dir/configs/idct.mat。则也会在解析过程中生成该文件。 生成idct.mat

    作者: ASR-beginer
    发表时间: 2020-07-02 11:13:10
    8475
    1
  • kaldi语音识别 chain模型的数据准备

    egs的可视化: 在介绍chain模型的数据准备过程之前,我们先来看一下所生成egs的具体内容: nnet3-chain-copy-egs ark:train.cegs ark,t:text.cegs 通过以上指令可将chain模型生成的egs由二进制文件转化成文本文件。具体形式如下图所示

    作者: ASR-beginer
    发表时间: 2020-07-02 11:00:32
    11793
    0
  • 语音识别】基于matlab男女声识别【含Matlab源码 452期】

    (2)隐马尔可夫法(HMM) 隐马尔可夫法(HMM) 是70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。HMM 方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。

    作者: 海神之光
    发表时间: 2022-05-28 19:33:32
    345
    0
  • 记录仪任务模式无网时(离线) 进行离线任务采集 - ISDP

    记录仪任务模式无网时(离线) 进行离线任务采集 有网时点击离线管理,将自动下载任务或问题到本地(仅下载最近的任务和问题各一百条)。 图1 离线数据待提交 选择任务待办卡片进入详情进行拍照、录像、录音附件采集,系统自动保存结果。

  • 设备异常离线 - 华为乾坤

    设备异常离线 设备离线后不能再上线 父主题: 常见故障处理

  • 车牌识别 - 文字识别 OCR

    车牌识别 功能介绍 识别输入图片中的车牌信息,并以JSON格式返回其坐标和内容。 该接口的使用限制请参见约束与限制,详细使用指导请参见OCR服务使用简介章节。 图1 车牌示例图 支持车牌信息、车牌颜色识别,支持双行车牌识别,支持单张图片内多个车牌识别。 目前支持车牌类型含小型汽车、