搜索_华为云

内容选择

内容分类

学堂博客论坛开发服务开发工具直播视频用户

时间

一周一个月三个月

内容选择

全部

内容选择

内容分类

学堂
博客
论坛
开发服务
开发工具
直播
视频
用户

时间

一周
一个月
三个月

DeleteVoiceTrainingJob 删除语音训练任务 - API

该API属于MetaStudio服务，描述: 删除语音训练任务接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

开发者 > 开发工具
CommitVoiceTrainingJob 提交语音训练任务 - API

该API属于MetaStudio服务，描述: 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

开发者 > 开发工具
预训练语音模型调研小结
预训练语音模型调研小结

预训练语音模型调研小结最近调研了一些预训练语音模型的论文，在此做一个小结，文章中会涉及到些许自己的理解，欢迎大家讨论与指正。

开发者 > 博客

作者： Hudson

发表时间： 2021-09-10 01:34:11

2362

0
ShowVoiceTrainingJob 查询语音训练任务详情 - API

该API属于MetaStudio服务，描述: 查询语音训练任务详情接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

开发者 > 开发工具
kaldi语音识别 chain模型的训练流程

1.训练phone级别的语言模型 chain模型类似于基于最大互信息的区分性训练，也需要分子和分母有限状态机。在分母有限状态机方面，区别于传统最大互信息的区分性训练，chain模型用训练数据的强制对齐结果，训练了一个四元语法音素单元的语言模型，并将其转成有限状态机。

开发者 > 博客

作者： ASR-beginer

发表时间： 2020-07-02 11:13:10

8475

1
CreateTrainingAdvanceJob 创建高级版语音训练任务 - API

该API属于MetaStudio服务，描述: 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。文件上传后,调用“提交语音训练任务”接口,启动审核和训练。

开发者 > 开发工具
CreateTrainingMiddleJob 创建进阶版语音训练任务 - API

* 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。文件上传后,调用“提交语音训练任务”接口,启动审核和训练。

开发者 > 开发工具
CreateTrainingBasicJob 创建基础版语音训练任务 - API

* 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。文件上传后,调用“提交语音训练任务”接口,启动审核和训练。

开发者 > 开发工具
ListVoiceTrainingJob 查询语音训练任务列表 - API

该API属于MetaStudio服务，描述: 查询语音训练任务列表接口URL: "/v1/{project_id}/voice-training-manage/user/jobs"

开发者 > 开发工具
训练语音数据集内容
训练语音数据集内容

由于模型训练过程需要大量有标签的音频数据，因此在模型训练之前需对没有标签的音频添加标签。通过ModelArts您可对音频进行一键式批量添加标签，快速完成对音频的标注操作，也可以对已标注音频修改或删除标签进行重新标注。

开发者 > 其他

作者：运气男孩

33

2
ShowJobAuditResult 获取语音训练任务审核结果 - API

该API属于MetaStudio服务，描述: 获取语音训练任务审核结果。接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result"

开发者 > 开发工具
语音合成
语音合成

语音合成支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。仅支持中文，文本不长于500个中文字。支持合成采样率8kHz、16kHz。父主题：使用限制

开发者 > 开发服务
语音识别-声学模型
语音识别-声学模型

GMM参数通过EM算法进行估计，可以使其在训练数据上生成语音观察特征的概率最大化。此外，GMM模型只要混合的高斯分布数目足够多，GMM可以拟合任意精度的概率分布。 1.3.2.

开发者 > 博客

作者：可爱又积极

发表时间： 2021-09-07 06:46:06

1977

0
【CANN训练营】【2022第二季】【新手班】迁移TensorFlow模型到昇腾设备实验复现

训练脚本自动迁移成昇腾AI处理器支持的脚本。

开发者 > 博客

作者： StarTrek

发表时间： 2022-07-22 13:15:02

1540

0
【语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

4.4 语音信号的频域分析语音信号的频域分析就是分析语音信号的频域持征。从广义上讲，语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等，而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

开发者 > 博客

作者：海神之光

发表时间： 2022-05-28 15:14:43

336

0
调用实时语音识别
调用实时语音识别

设置尾部最大静音时间，[0, 3000], 默认500ms， request.setVadTail(DEFAULT_TAIL_SILENCE_TIME); // 4.

开发者 > 开发服务
RunAudioAssessment 语音评测 - API
RunAudioAssessment 语音评测 - API

该API属于SIS服务，描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

开发者 > 开发工具
调用实时语音识别
调用实时语音识别

rasr_client.close() if __name__ == '__main__': rasr_example() 父主题： Python调用语音交互服务

开发者 > 开发服务
HarmonyOS之AI能力·语音识别技术

它基于华为智慧引擎（HUAWEI HiAI Engine）中的语音识别引擎，向开发者提供人工智能应用层 API。该技术可以将语音文件、实时语音数据流转换为汉字序列，准确率达到 90% 以上（本地识别 95%）。

开发者 > 博客

作者： Serendipity·y

发表时间： 2022-02-16 16:05:13

848

0
调用语音合成
调用语音合成

property 否 String 特征字符串，{language}_{speaker}_{domain}，默认chinese_xiaoqi_common。

开发者 > 开发服务

总条数： 10000

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

DeleteVoiceTrainingJob 删除语音训练任务 - API

CommitVoiceTrainingJob 提交语音训练任务 - API

预训练语音模型调研小结

ShowVoiceTrainingJob 查询语音训练任务详情 - API

kaldi语音识别 chain模型的训练流程

CreateTrainingAdvanceJob 创建高级版语音训练任务 - API

CreateTrainingMiddleJob 创建进阶版语音训练任务 - API

CreateTrainingBasicJob 创建基础版语音训练任务 - API

ListVoiceTrainingJob 查询语音训练任务列表 - API

训练语音数据集内容

ShowJobAuditResult 获取语音训练任务审核结果 - API

语音合成

语音识别-声学模型

【CANN训练营】【2022第二季】【新手班】迁移TensorFlow模型到昇腾设备实验复现

【语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

调用实时语音识别

RunAudioAssessment 语音评测 - API

调用实时语音识别

HarmonyOS之AI能力·语音识别技术

调用语音合成

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线