华为云首页用户手册

AI开发平台MODELARTS-准备数据:声音分类的数据要求

AI开发平台MODELARTS-准备数据:声音分类的数据要求

时间：2024-08-27 15:16:52

AI开发平台MODELARTS

声音分类的数据要求

音频只支持16bit的WAV格式。支持WAV的所有子格式。

单条音频时长应大于1s，大小不能超过4MB。
适当增加训练数据，会提升模型的精度。声音分类建议每类音频至少50条，每类音频总时长至少5分钟。
建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。
训练集的数据质量对于模型的精度有很大影响，建议训练集音频的采样率和采样精度保持一致。
标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。
音频标注涉及到的标注标签和声音内容只支持中文和英文，不支持小语种。

上一篇：AI开发平台MODELARTS-准备数据:数据上传至OBS

下一篇：AI开发平台MODELARTS-准备数据:数据上传至OBS

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

AI开发平台MODELARTS-准备数据:声音分类的数据要求

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题