内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

    确的数值关系。 4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法带通滤波器组法、傅里叶变换法、线件预测法等几种。因为语音波是一个非平稳过程,因此适用

    作者: 海神之光
    发表时间: 2022-05-28 15:14:43
    336
    0
  • 语音识别-声学模型

    首先简单介绍一下DNN模型,DNN模型是一个很多隐层的多层感知机,下图就是具有5层的DNN,模型结构上包括输入层、隐层和输出层。对于第层,公式 其中 分别表示,L层的输出向量,权重矩阵,输入向量以及偏差向量(bias); f(·) 一般称为激活函数,常用的激活函数sigmoid函数

    作者: 可爱又积极
    发表时间: 2021-09-07 06:46:06
    1977
    0
  • 语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】

    完整代码已上传我的资源:【语音分析】基于matlab语音短时频域分析【含Matlab源码 558期】 备注: 订阅紫极神光博客付费专栏,可免费获得1份代码(有效期为订阅日起,三天内有效); 二、短时频域分析简介 语音信号的频域分析就是分析语音信号的频域特征。从广义上讲,语音信号的频域分析

    作者: 海神之光
    发表时间: 2022-05-28 18:56:58
    265
    0
  • 语音合成

    语音合成 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 仅支持中文,文本不长于500个中文字。 支持合成采样率8kHz、16kHz。

  • 语音合成

    语音合成 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 仅支持中文,文本不长于500个中文字。 支持合成采样率8kHz、16kHz。 父主题: 使用限制

  • RunAudioAssessment 语音评测 - API

    该API属于SIS服务,描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

  • HarmonyOS之AI能力·语音识别技术

    支持开发具有语音识别需求的第三方应用,如语音输入法、语音搜索、实时字幕、游戏娱乐、社交聊天、人机交互(如驾驶模式)等场景。语音输入法:将需要输入的文字,直接用语音的方式输入。即用户说话的时候语音识别引擎返回识别的汉字序列,让输入更加便捷,解放双手。语音搜索:搜索内容直接以语音的方式输

    作者: Serendipity·y
    发表时间: 2022-02-16 16:05:13
    848
    0
  • 数字人语音驱动

    数字人语音驱动 该场景示例代码以数字人语音驱动为例,介绍如何使用MetaStudio Java SDK将输入的文本数据转换为驱动数字的表情基系数和肢体动作数据。 数字人语音驱动的接口调用时序如下: 图1 语音驱动接口调用时序

  • 启动语音合成

    启动语音合成 您可以根据自己的业务逻辑进行优化、修改rtts.xml前端界面和RttsActivity.class代码,执行RttsActivity.class代码效果如下。 父主题: Android端调用语音交互服务

  • 实时语音识别

    实时语音识别 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言的语音识别,其中方言包括:四川话、粤语和上海话。 方言和英语仅支持“华北-北京四”区域。

  • 实时语音识别

    实时语音识别 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 音频采样率8KHz或者16KHz,采样位数8bit或者16bit。 支持中文普通话、方言的语音识别,其中方言包括:四川话、粤语和上海话。 方言和英语仅支持“华北-北京四”区域。

  • 启动语音合成

    启动语音合成 您可以根据自己的业务逻辑进行优化、修改rtts.xml前端界面和RttsActivity.class代码,执行RttsActivity.class代码效果如下。

  • 新手语音入门(三): 语音识别ASR算法初探 | 编码与解码 | 声学模型与语音模型 | 贝叶斯公式 | 音素

    为了一体。 语音识别的问题可以看做是语音到文本的对应关系,语音识别问题大体可以归结为文本基本组成单位的选择上。单位不同,则建模力度也随之改变。 图4 语音识别的基本途径 根据图中文本基本组成单位从大到小分别是: 整句文本,如“Hello World”,对应的语音建模尺度为整条语音。

    作者: 黄辣鸡
    发表时间: 2021-12-27 07:11:12
    4152
    0
  • 语音识别与语音控制

    向右转”、“向前走”、“向后退”命令词,语音算法sdk经过智能处理后输出识别结果,log显示如下 ​ 识别到语音命令词“向前走”、“向左转”、“向右转&rd

    作者: 梦笔生花
    发表时间: 2024-10-16 22:01:04
    111
    0
  • DeleteDemoInfo 删除语音作业 - API

    该API属于VCM服务,描述: 删除语音作业接口URL: "/v2/{project_id}/services/audio-moderation/tasks/{task_id}"

  • 语音语音识别介绍

    务可以通过深度神经网络单独训练或者联合训练。 语音识别 语音识别指的是将语音信号转化为文字序列,是所有基于语音交互的基础。 语音识别是语音领域最重要的任务,下面将进行详细介绍。 语音识别 语音识别技术,也可以称为自动语音识别(Automatic Speech Recog

    作者: HWCloudAI
    发表时间: 2022-12-12 07:46:32
    373
    0
  • 调用语音合成

    可选择不保存到本地。需具体到文件,如D:/test.wav /** * 用于语音合成参数设置,例如发声人、音高、语速、音量、采样率、连接超时。所有参数均可以不设置,采用默认。 * * @param request 语音合成请求 */ private void setPar

  • 调用语音合成

    可选择不保存到本地。需具体到文件,如D:/test.wav /** * 用于语音合成参数设置,例如发声人、音高、语速、音量、采样率、连接超时。所有参数均可以不设置,采用默认。 * * @param request 语音合成请求 */ private void setPar

  • 启动实时语音识别

    启动实时语音识别 您可以根据自己的业务逻辑进行优化、修改rasr.xml前端界面和RasrCsActivity.class代码,执行RasrCsActivity.class代码效果如下。 父主题: Android端调用语音交互服务

  • 语音合成 - 代码示例

    语音合成,调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速、音高等,可自定义音频格式,为企业和个人提供个性化的发音服务。