内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 离线语音识别与在线语音识别的区别

    原因很简单,因为你所测试的是科大讯飞在线语音识别模块,而我们的是离线的语音识别模块。

    作者: aiot_bigbear
    发表时间: 2022-09-24 16:33:34
    190
    0
  • 语音合成

    语音合成 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 仅支持中文,文本不长于500个中文字。 支持合成采样率8kHz、16kHz。 父主题: 使用限制

  • 语音转换测试

    作者: yd_210684270
    328
    0
  • post/speechDetect/index 在线语音识别 - API

    该API属于APIHub22579服务,描述: 通过上传的语音识别,识别语音内容。支持上传完整的录音文件,录音文件时长不超过60秒。

  • RunAudioAssessment 语音评测 - API

    该API属于SIS服务,描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

  • 语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

    4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

    作者: 海神之光
    发表时间: 2022-05-28 15:14:43
    336
    0
  • 语音识别-声学模型

    在很多测试集上CD-DNN-HMM模型都大幅度超越了GMM-HMM模型。 首先简单介绍一下DNN模型,DNN模型是有一个有很多隐层的多层感知机,下图就是具有5层的DNN,模型结构上包括输入层、隐层和输出层。

    作者: 可爱又积极
    发表时间: 2021-09-07 06:46:06
    1977
    0
  • 数字人语音驱动

    数字人语音驱动 该场景示例代码以数字人语音驱动为例,介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。

  • 启动语音合成

    启动语音合成 您可以根据自己的业务逻辑进行优化、修改rtts.xml前端界面和RttsActivity.class代码,执行RttsActivity.class代码效果如下。 父主题: Android端调用语音交互服务

  • 实时语音识别

    实时语音识别 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言的语音识别,其中方言包括:四川话、粤语和上海话。

  • 语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

    因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。

    作者: 海神之光
    发表时间: 2022-05-28 18:56:58
    265
    0
  • 科大讯飞语音转文字以及中文分词的Java测试代码

    我录了一段音存储在这个test.m4a文件里,语音内容为"测试一下Netweaver对于并发请求的响应性能"。

    作者: Jerry Wang
    发表时间: 2021-10-16 14:28:03
    2195
    0
  • 语音识别与语音控制

    语音控制 SSH连接OriginBot成功后,配置智能语音模块: #从TogetheROS的安装路径中拷贝出运行示例需要的配置文件。 cp -r /opt/tros/lib/hobot_audio/config/ .

    作者: 梦笔生花
    发表时间: 2024-10-16 22:01:04
    111
    0
  • DeleteDemoInfo 删除语音作业 - API

    该API属于VCM服务,描述: 删除语音作业接口URL: "/v2/{project_id}/services/audio-moderation/tasks/{task_id}"

  • 语音语音识别介绍

    语音识别 语音识别指的是将语音信号转化为文字序列,是所有基于语音交互的基础。 语音识别是语音领域最重要的任务,下面将进行详细介绍。

    作者: HWCloudAI
    发表时间: 2022-12-12 07:46:32
    373
    0
  • 什么是语音识别的语音搜索?

    前言 随着智能手机、智能音箱等智能设备的普及,语音搜索已经成为了一种趋势。语音搜索不仅方便快捷,而且可以实现双手的解放。语音搜索的实现离不开语音识别技术,本文将详细介绍语音识别的语音搜索。 语音识别的基本原理 语音识别是将语音信号转换为文本的技术。

    作者: wljslmz
    发表时间: 2023-05-11 23:05:36
    25
    0
  • 什么是语音识别的语音助手?

    前言 语音助手已经成为现代生活中不可或缺的一部分。人们可以通过语音助手进行各种操作,如查询天气、播放音乐、发送短信等。语音助手的核心技术是语音识别。本文将详细介绍语音识别的语音助手。 语音识别的基本原理 语音识别是将语音信号转换为文本的技术。

    作者: wljslmz
    发表时间: 2023-05-11 23:04:47
    24
    0
  • 调用语音合成

    具体信息请参见《API参考》中语音合成章节。

  • 语音合成 - 代码示例

    语音合成,调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业和个人提供个性化的发音服务。

  • 语音合成 - 代码示例

    语音合成,调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业和个人提供个性化的发音服务。