内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • DeleteVoiceTrainingJob 删除语音训练任务 - API

    该API属于MetaStudio服务,描述: 删除语音训练任务接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

  • CommitVoiceTrainingJob 提交语音训练任务 - API

    该API属于MetaStudio服务,描述: 提交训练任务,执行该接口后,任务会进入审核状态,审核完成后会等待训练。接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

  • 训练语音模型调研小结

    训练语音模型调研小结 最近调研了一些预训练语音模型的论文,在此做一个小结,文章中会涉及到些许自己的理解,欢迎大家讨论与指正。

    作者: Hudson
    发表时间: 2021-09-10 01:34:11
    2362
    0
  • ShowVoiceTrainingJob 查询语音训练任务详情 - API

    该API属于MetaStudio服务,描述: 查询语音训练任务详情接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}"

  • kaldi语音识别 chain模型的训练流程

    1.训练phone级别的语言模型 chain模型类似于基于最大互信息的区分性训练,也需要分子和分母有限状态机。在分母有限状态机方面,区别于传统最大互信息的区分性训练,chain模型用训练数据的强制对齐结果,训练了一个四元语法音素单元的语言模型,并将其转成有限状态机。

    作者: ASR-beginer
    发表时间: 2020-07-02 03:13:10
    5325
    1
  • CreateTrainingAdvanceJob 创建高级版语音训练任务 - API

    该API属于MetaStudio服务,描述: 用户创建语音训练高级版任务,该接口会返回一个obs上传地址,用于上传语音文件。 语音文件为一段WAV格式的长音频文件,仅支持将语音文件打包成zip压缩格式上传。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练

  • CreateTrainingMiddleJob 创建进阶版语音训练任务 - API

    * 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练

  • CreateTrainingBasicJob 创建基础版语音训练任务 - API

    * 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练

  • ListVoiceTrainingJob 查询语音训练任务列表 - API

    该API属于MetaStudio服务,描述: 查询语音训练任务列表接口URL: "/v1/{project_id}/voice-training-manage/user/jobs"

  • 训练语音数据集内容

    由于模型训练过程需要大量有标签的音频数据,因此在模型训练之前需对没有标签的音频添加标签。通过ModelArts您可对音频进行一键式批量添加标签,快速完成对音频的标注操作,也可以对已标注音频修改或删除标签进行重新标注。

    作者: 运气男孩
    29
    2
  • ShowJobAuditResult 获取语音训练任务审核结果 - API

    该API属于MetaStudio服务,描述: 获取语音训练任务审核结果。接口URL: "/v1/{project_id}/voice-training-manage/user/jobs/{job_id}/audit-result"

  • 语音合成

    语音合成 支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。 仅支持中文,文本不长于500个中文字。 支持合成采样率8kHz、16kHz。 父主题: 使用限制

  • 语音识别-声学模型

    GMM参数通过EM算法进行估计,可以使其在训练数据上生成语音观察特征的概率最大化。此外,GMM模型只要混合的高斯分布数目足够多,GMM可以拟合任意精度的概率分布。 1.3.2.

    作者: 可爱又积极
    发表时间: 2021-09-07 06:46:06
    1977
    0
  • 【CANN训练营】【2022第二季】【新手班】迁移TensorFlow模型到昇腾设备实验复现

    训练脚本自动迁移成昇腾AI处理器支持的脚本。

    作者: StarTrek
    发表时间: 2022-07-22 13:15:02
    1540
    0
  • HarmonyOS之AI能力·语音识别技术

    它基于华为智慧引擎(HUAWEI HiAI Engine)中的语音识别引擎,向开发者提供人工智能应用层 API。该技术可以将语音文件、实时语音数据流转换为汉字序列,准确率达到 90% 以上(本地识别 95%)。

    作者: Serendipity·y
    发表时间: 2022-02-16 16:05:13
    848
    0
  • 语音采集】基于matlab语音采集及处理【含Matlab源码 1737期】

    4.4 语音信号的频域分析 语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶变换法、线件预测法等几种。

    作者: 海神之光
    发表时间: 2022-05-28 15:14:43
    336
    0
  • 调用实时语音识别

    设置尾部最大静音时间,[0, 3000], 默认500ms, request.setVadTail(DEFAULT_TAIL_SILENCE_TIME); // 4.

  • 【MindSpore】【语音识别】DFCNN网络训练loss不收敛

    我参考了Model Arts的例子想要用MindSpore也实现语音识别,根据脚本迁移了网络。网络最后是调通了,但是Loss不收敛,训练得到的模型推理结果比预期长了一段。请问有专家可以帮忙看看问题出在哪里吗?

    作者: Daniel46010140
    1739
    3
  • RunAudioAssessment 语音评测 - API

    该API属于SIS服务,描述: 口语评测接口,基于一小段朗读语音和预期文本,评价朗读者发音质量。当前仅支持华北-北京四。接口URL: "/v1/{project_id}/assessment/audio"

  • 什么是语音识别的语音搜索?

    教育 语音搜索可以为教育用户提供更加快捷、便利的搜索服务,如查询资料、课程信息等。 语音搜索的未来发展 随着人工智能技术的不断发展,语音搜索的未来发展前景非常广阔。未来的语音搜索将会更加精准、便捷,同时还会实现更加智能化的操作,如语音交互等。

    作者: wljslmz
    发表时间: 2023-05-11 23:05:36
    25
    0