内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 【云驻共创】智能AI语音技术的高水平应用

    三、核心技术 智能语音技术涉及多类型学科,其核心技术包括语音识别、声纹识别、自然语言处理、语音合成、语音去燥等关键技术。 3.1 语音识别 语音识别技术也被称为自然语言识别,目的就是将人类的语音中的词汇内容转换为计算机可读的输入。

    作者: 静Yu
    发表时间: 2022-05-30 11:15:26
    1211
    0
  • 玩转行业数字化转型 | 全新华为云Astro低代码平台带你起飞

    『Astro 工作流』(即『Astro Flow』):智能工作流,通过AI能力识别用户自然语言,自动生成工作流;完善的开放和接入能力,整合企业通讯录、权限与留存系统;通过开源BPMN引擎深度改写与定制,具备承载亿级别数据的高性能与良好的功能扩展性。

    作者: 华为云PaaS服务小智
    发表时间: 2023-11-28 15:00:30
    123
    0
  • 语音识别-声学模型

    DNN应用到语音识别领域后取得了非常明显的效果,DNN技术的成功,鼓舞着业内人员不断将新的深度学习工具应用到语音识别上,从CNN到RNN再到RNN与CTC的结合等等,伴随着这个过程,语音识别的性能也在持续提升,未来我们可以期望将可以和机器进行无障碍的对话。

    作者: 可爱又积极
    发表时间: 2021-09-07 06:46:06
    1977
    0
  • 浅谈实时语音识别应用场景_公安

    通过结合实时语音识别技术和自然语言理解技术,当询问笔录开始制作时,实时办案民警与被询问人之间的对话内容进行识别,并将识别到的内容按照语法和自然语言调整识别结果。自然语言理解技术还可以将语音中出现的语气词自动过滤,对关键词类型提取,最终输出正确、精练的文字。

    作者: QGS
    22
    2
  • 华为云智能编程助手CodeArts Snap开放邀测!

     函数级代码自动生成     可以通过自然语言识别做到函数级的多行代码生成,开发者仅需在定义好的函数签名末尾处敲下“回车键”,CodeArts Snap将生成符合业务逻辑的完整函数代码(如下图)。

    作者: DevAI
    发表时间: 2023-02-19 08:34:47
    1861
    2
  • 离线语音识别与在线语音识别的区别

    离线的语音识别和在线的语音识别是有所差距的: l 离线语音识别:固定词条,不需要连接网络,但是识别率稍低 l 在线语音识别:词条不固定,需要连接网络,识别率较高,但是效果会受网络影响, 价格相对较高 产生差距的原因有两点: ① 语音识别比较重要的一个因素是:语音库,它作为识别过程中对比的数据

    作者: aiot_bigbear
    发表时间: 2022-09-24 16:33:34
    190
    0
  • GitHub开源:支持100多种语言的OCR文字识别

    之前为给位朋友分享过:GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理,该项目仅仅支持中文OCR识别,本篇博文将分享支持100多种语言的OCR文字识别项目:Tesseract OCR。

    作者: 不脱发的程序猿
    发表时间: 2020-12-31 00:08:22
    8760
    0
  • 浅谈语音识别

    语言模型:根据相关语言学理论,计算出声音片段可能词组序列的概率。语音解码和搜索算法:根据声学模型+发音词典+语音模型构建的搜索空间,找到最合适的路径。解码完成后最终输出文本。语音识别系统的组成一个完整的语音识别系统包括:预处理、特征提取、声学模型训练、语言模型训练、语音解码器。

    作者: QGS
    65
    1
  • MindSpore21天实战营(5):基于Wide&Deep;实现CTR预估实战

    ## 前言 尽管之前参与的【2020华为云AI实战营】,涉及到8大热门领域:图像分类、物体检测、自然语言处理NLP、OCR文字识别、图像分割、视频分析、人脸识别以及语言识别,也接触到了ResNet50、Faster RCNN、YOLOv3、BERT等算法模型,MindSpore 21

    作者: 胡琦
    4100
    5
  • NLP VS NLU:彼此替代还是互相融合?

    NLP的任务NLP广义上指语音识别、自然语言识别、以及自然语言生成等一系列工具。

    作者: HWCloudAI
    发表时间: 2019-08-19 10:49:11
    6537
    0
  • 浅谈语音识别

    语言模型:根据相关语言学理论,计算出声音片段可能词组序列的概率。语音解码和搜索算法:根据声学模型+发音词典+语音模型构建的搜索空间,找到最合适的路径。解码完成后最终输出文本。语音识别系统的组成一个完整的语音识别系统包括:预处理、特征提取、声学模型训练、语言模型训练语音解码器。

    作者: QGS
    71
    1
  • 语音识别模型

    简介 Whisper 是 OpenAI 的一项语音处理项目,旨在实现语音的识别、翻译和生成任务。作为基于深度学习的语音识别模型,Whisper 具有高度的智能化和准确性,能够有效地转换语音输入为文本,并在多种语言之间进行翻译。

    作者: 霍格沃兹测试开发
    发表时间: 2024-10-29 17:30:40
    122
    0
  • 语音识别中的transformer(只用encoder)语言模型理解

    vim /espnet/espnet/nets/pytorch_backend/lm/transformer.py 语言模型整体实现音素序列到文字序列的解码过程,建模单元为汉字。

    作者: 可爱又积极
    发表时间: 2022-03-04 07:22:35
    2827
    0
  • 语音识别未来

    技术前沿神经网络RNN、LSTM、BiLSTM、FNN、DFSMN、LCBLSTM,LFR-LCBLSTM等自适应技术i-vector、AEC等语言模型N-gram、word2vec等语音识别难点远场麦克风识别高噪音场景语音识别多人语音识别交谈背景语音识别非标准语音识别

    作者: G-washington
    1298
    1
  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。

  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。

  • 【计算理论】下推自动机 PDA 及 计算示例

    语言识别能力 : 确定性有限自动机 ( DFA ) 是不能识别 { 0 n

    作者: 韩曙亮
    发表时间: 2022-01-10 17:36:20
    250
    0
  • 浅谈无监督学习—聚类

    高斯混合模型经常被用于信号处理、语言识别、异常检测和音乐的流派分类。

    作者: QGS
    36
    3
  • 人脸识别

    人脸识别 场景介绍 对输入图片进行人脸检测和分析,输出人脸在图像中的位置、人脸关键点位置和人脸关键属性。 流程一览 操作步骤 开通服务 登录人脸识别服务控制台。

  • 【语音识别】玩转语音识别 2 知识补充

    语音识别技术可以将语音转换为计算机可读的输入, 让计算机明白我们要表达什么, 实现真正的人机交互. 希望通过本专栏的学习, 大家能够对语音识别这一领域有一个基本的了解.

    作者: 我是小白呀iamarookie
    发表时间: 2021-11-22 15:07:32
    2567
    0