内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • daka语音识别

    作者: 宝哥哥
    825
    3
  • 语音分析】基于matlab GUI语音信号线性预测(LPC)分析【含Matlab源码 910期】

    四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

    作者: 海神之光
    发表时间: 2022-05-28 19:08:01
    268
    0
  • 文字识别-Aster

    描述Aster(文字识别/PyTorch)1. 概述此模型是基于ASTER: Attentional Scene Text Recognizer with Flexible Rectification的Pytorch实现版本,该算法需要使用SynthText和MJSynth数据集

    作者: 开发者创新中心小广播
    1583
    0
  • 语音通话_语音验证码应用开发

    "语音通话开发指导教程系列用于指导语音通话服务的开发者使用语音通话提供的代码样例进行业务开发。 本视频用于指导开发者进行语音验证码应用开发。"

    播放量  30119
  • 车载语音识别的算法

    车载语音识别系统主要采用自动语音识别(ASR)技术,而ASR算法又可以分为基于规则的算法和基于统计学习的算法。基于规则的算法主要是基于语言学和信号处理技术,通过设计规则和滤波器等手段,对输入的语音信号进行处理和分析,提取出语音特征,然后与预定义的词库进行匹配,找到最匹配的词或短语

    作者: 运气男孩
    32
    0
  • 语音识别的特殊之处

    型的识别案例错误率降低了一个层次,所以基于深度学习的语音识别技术也正在逐渐成为语音识别领域的核心。语音识别发展到如今,无论是基于传统声学模型的语音识别系统还是基于深度学习的语音识别系统,语音识别的各个模块都是分开优化的。但是语音识别本质上是一个序列识别问题,如果模型中的所有组件都

    作者: 黄生
    31
    3
  • 【云驻共创】智能AI语音技术的高水平应用

    投入到这项研究工作中去。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音语音的翻译。部分摘录自《智能控制在语音识别中的应用 》。 3

    作者: 静Yu
    发表时间: 2022-05-30 11:15:26
    1211
    0
  • 深度学习视觉语音分析

    视觉语音,即语音的视觉领域,因其在公共安全、医疗、军事防御、影视娱乐等领域的广泛应用而受到越来越多的关注。深度学习技术作为一种强大的人工智能策略,广泛地推动了视觉语音学习的发展。在过去的五年中,许多基于深度学习的方法被提出来解决这一领域的各种问题,特别是视觉语音的自动识别和生成。

    作者: 可爱又积极
    314
    2
  • icd的默认语音调试

    问题来源】【必填】    贵州119【问题简要】【必填】   电话进线排队时无排队的语音提示,我想知道,这些默认的语音是有单独的语音包吗。   【问题类别】【必填】  icd【AICC解决方案版本】【必填】 ICDV300R008C25【期望解决时间】【选填】     尽快解决【问题现象描述】【必填】

    作者: szxc
    457
    1
  • 文字生成图片

    文字生成图片:蓝色星空

    作者: yd_267945928
    92
    1
  • 【问答官】场景文字检测

    请根据所学,解释以下场景文字检测—CTPN原理与实现

    作者: 初学者7000
    1125
    5
  • 智能语音解决语音访问网站和应用的通用性解决方案

    中国”“迪士尼.公司”“亚马逊.公司”。实现语音输入中文域名就能让成千上万的企业网站和应用接入到语音平台,解决了语音接入通用性的问题,是从语音识别到语音操控锐变的重要一步,而智能语音也通过如此来成为入口级的应用,成为百度那样的超大规模的语音搜索平台。16228162291623016231162321623316234

    作者: 数据智能
    5883
    1
  • OCR 中识别文字

    location 表示文字块的四个顶点 是那四个点可以举例说下吗?

    作者: 张三丰
    6820
    3
  • 请问语音交互服务是什么

    语音交互服务包括了哪些功能

    作者: yd_244625684
    100
    5
  • CreateTrainingMiddleJob 创建进阶版语音训练任务 - API

    该API属于MetaStudio服务,描述: 用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: * 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99

  • CreateTrainingBasicJob 创建基础版语音训练任务 - API

    该API属于MetaStudio服务,描述: 用户创建语音训练基础版任务,该接口会返回一个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: * 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~19

  • 语音合成的应用场景

    应用场景详细描述语音导航使用语音合成服务将车载导航数据转换语音素材,为用户提供精确的语音导航服务。利用个性化定制能力,提供丰富的导航语音服务。有声读物将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。电话回访

    作者: 极客潇
    2348
    1
  • 语音交互服务 Python - SDK

    pip install huaweicloudsdksis

  • 语音交互服务 .NET - SDK

    dotnet add package HuaweiCloud.SDK.Sis

  • 语音交互服务 Java - SDK

    <dependency> <groupId>com.huaweicloud.sdk</groupId> <artifactId>huaweicloud-sdk-sis</artifactId> <version>3.1.9</version> </dependency>