内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • [python]基于faster whisper实时语音识别语音转文

    isper更精准的定位语音开始和结束的位置。 faster whisper地址: https://github.com/SYSTRAN/faster-whisper 实现功能: 从麦克风获取声音进行实时语音识别转文本 代码仅仅用了40多行即可实现实时语音转文本功能 封装成类调用十分简单,代码如下:

    作者: futureflsl
    发表时间: 2023-12-31 20:51:28
    2
    0
  • 语音播报】基于matlab语音播报【含Matlab源码 507期】

    81 三、运行结果 实际效果为语音播报 四、matlab版本及参考文献 1 matlab版本 2014a 2 参考文献 [1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019. [2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019

    作者: 海神之光
    发表时间: 2022-05-28 18:12:08
    280
    0
  • 启动实时语音识别

    启动实时语音识别 您可以根据自己的业务逻辑进行优化、修改rasr.xml前端界面和RasrCsActivity.class代码,执行RasrCsActivity.class代码效果如下。 父主题: Android端调用语音交互服务

  • 调用语音合成

    合成后生成的语音数据,以Base64编码格式返回。用户如需生成音频,需要将Base64编码解码成byte数组,再保存为wav音频。 说明: 语音数据输出的格式为wav格式。

  • 5分钟云上开发体验:通过CodeArts IDE插件调用API,高效合成语音

    2.3 体验API①搜索API,在CodeArts IDE客户端内,打开“华为云API”,搜索“语音合成”,选择第一个搜索结果②右侧弹出RunTts详细情况,可以查看API相关信息,包括(API是干啥的,有哪些参数)然后选择“调试API”页签③输入需要合成的文字,例如“华为云软

    作者: 华为云PaaS服务小智
    399
    0
  • 语音合成WebSocket版

    否 String 待合成的音频格式,可选mp3,wav等,默认wav。具体信息请参见《API参考》中语音合成章节。 pitch 否 Integer

  • post/v1/device/message/send_voice 语音下发 - API

    API属于APIHub160298服务,描述: 语音下发接口URL: "/v1/device/message/send_voice"

  • 实时语音识别连续模式

    是 String 音频格式,支持pcm,alaw,ulaw等,如pcm8k16bit,参见《API参考》中开始识别章节。 property 是 String

  • 体验文字转定制化语音功能

    作者: hw大大白
    122
    0
  • 离线语音识别与在线语音识别的区别

    语音识别比较重要的一个因素是:语音库,它作为识别过程中对比的数据 在线的语音库在云端,存储的数据是非常庞大的;而离线的语音库在本地,空间是有限的,那样对比的数据样本差异就比较大,假设输入的语音“打开灯”,那么识别的过程就会将此语音拿来与语音库中的声音样本做对比,语音库中数据样本越多

    作者: aiot_bigbear
    发表时间: 2022-09-24 16:33:34
    190
    0
  • Python使用语音合成的sdk时报错APIGW.0802

    rt, 

    作者: 垚一堯
    4897
    2
  • API经济下,如何玩转API

    API到底有啥用?随着API经济的兴起,越来越多的技术服务企业选择通过API接口形式把数据、服务和业务能力开放给生态系统各参与方,以实现业务能力的互联互通,共创新的价值网络。那么,API接口究竟有何用?作为API经济的承载体,API可以说是为技术需求方与技

    作者: Deepfinch
    发表时间: 2019-11-05 04:54:03
    4371
    1
  • API 网关 ( API gateway )

    们就需要一个 API 网关来接收从千百个终端发出的请求,它实现对外统一接口,对内进行负载均衡的功能。极大的方便了 API系统 的开发与维护。如果有需要,API 网关也可以根据各终端使用的不同通信协议来进行协议适配,从而方便应用层进行数据采集和分析。 什么是 API 网关? 在想了解什么是API

    作者: 拿我格子衫来
    发表时间: 2022-03-17 17:12:08
    678
    0
  • 语音编辑】基于matlab语音编辑【含Matlab源码 539期】

    二、简介 实验目的 1.掌握语音信号线性叠加的方法,实现非等长语音信号的叠加 2.熟悉语音信号卷积原理,实现两语音卷积。 3.熟悉语音信号升采样/降采样方法。 实验原理 1.信号的叠加 两个信号X1和X2,通过短时信号的补零,使两语音信号有相同的长度,叠加信号为 叠加白噪声通过生成随机信号的方法来实现

    作者: 海神之光
    发表时间: 2022-05-28 17:43:52
    245
    0
  • 通过无服务器API构建语音识别Web应用 - 代码示例

    通过函数工作流和APIG触发器构建一个无服务器API,在函数中调用人工智能服务提供的语音识别接口,实现语音识别功能,将语音转化为文字

  • 通过无服务器API构建语音识别Web应用 - 代码示例

    通过函数工作流和APIG触发器构建一个无服务器API,在函数中调用人工智能服务提供的语音识别接口,实现语音识别功能,将语音转化为文字

  • LTE语音是什么

    上使用为控制层面(Control plane)和语音服务的媒体层面(Media plane)特制的配置文件(由 GSM 协会在 PRD IR.92 中定义),这使语音服务(控制和媒体层面)作为数据流在 LTE 数据承载网络中传输,而不再需维护和依赖传统的电路交换语音网络。VoLTE 的语音和数据容量超过 3G

    作者: 旧时光里的温柔
    1141
    0
  • 语音识别

    为什么要分帧加窗 语音信号处理需要弄清楚语音中各个频率成分的分布。做这件事情的数学工具是傅里叶变换。傅里叶变换要求输入信号是平稳的。而语音在宏观上来看是不平稳的——你的嘴巴一动,信号的特征就变了。但是从微观上来看,在比较短的时间内,嘴巴动得是没有那么快的,语音信号就可

    作者: xql
    发表时间: 2021-08-25 07:06:17
    2180
    0
  • java语音播报案例

    content, int type) { // ?? 这个Sapi.SpVoice是需要安装什么东西吗,感觉平白无故就来了 ActiveXComponent sap = new ActiveXComponent("Sapi.SpVoice"); // Dispatch是做什么的?

    作者: 穆雄雄
    发表时间: 2022-12-17 03:21:50
    119
    0
  • 实时语音识别 - 代码示例

    基于websocket接口对输入的音频流进行识别,实时返回识别结果。