使用自动学习实现声音分类-华为云

AI开发平台MODELARTS-准备声音分类数据:声音分类的数据要求

声音分类的数据要求音频只支持16bit的WAV格式。支持WAV的所有子格式。单条音频时长应大于1s，大小不能超过4MB。适当增加训练数据，会提升模型的精度。声音分类建议每类音频至少20条，每类音频总时长至少5分钟。建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。训练集的数据质量对于模型的精度有很大影响，建议训练集音频的采样率和采样精度保持一致。标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。音频标注涉及到的标注标签和声音内容只支持中文和英文，不支持小语种。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:数据上传至OBS

数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：如不需要提前上传训练数据，请创建一个空文件夹用于存放工程后期生成的文件。如：“/bucketName/data-cat”。如需要提前上传待标注的音频，请创建一个空文件夹，然后将音频文件保存在该文件夹下，音频的目录结构如：“/bucketName/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的音频，至少有2种以上的分类，每种分类的音频数据数不少20条。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-创建声音分类项目:创建项目

创建项目登录ModelArts管理控制台，在左侧导航栏单击“自动学习”，进入新版自动学习页面。在您需要的自动学习项目列表中，单击“创建项目”，进入创建自动学习项目界面。在创建自动学习项目页面，计费模式默认“按需计费”，参考表1填写相应参数。表1 参数说明参数说明 “名称” 项目的名称。名称只能包含数字、字母、下划线和中划线，长度不能超过64位且不能为空。名称请以字母开头。名称不允许重复。 “描述” 对项目的简要描述。 “数据集” 可在右侧下拉框选择已有数据集，或单击“创建数据集”前往新建数据集。已有数据集：在“数据集”右侧的下拉框中选择，仅展示同类型的数据集供选择。创建数据集：前往创建数据集页面创建一个新的数据集。具体操作请参考创建数据集。 “输出路径” 选择自动学习数据输出的统一OBS路径。说明： “输出路径”是存储自动学习在运行过程中所有产物的路径。 “训练规格” 选择自动学习训练节点所使用的资源规格，以实际界面显示为准，将会根据不同的规格计费。说明：只有北京四区域支持限时免费规格。如果您购买了套餐包，可优先选择您对应规格的套餐包，在“配置费用”处会显示您的套餐余量，以及超出的部分如何计费，请您关注，避免造成不必要的资源浪费。单击“创建项目”，声音分类项目创建成功后页面自动跳转到“自动学习工作流”。声音分类项目的工作流，将依次运行如下节点：数据标注：对您的数据进行标注情况确认。数据集版本发布：将已完成确认的数据进行版本发布。数据校验：对您的数据集的数据进行校验，是否存在数据异常。声音分类：将发布好的数据集版本进行训练，生成对应的模型。模型注册：将训练后的结果注册到模型管理中。服务部署：将生成的模型部署为在线服务。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-创建声音分类项目:快速查找创建好的项目

快速查找创建好的项目在自动学习总览页，您可以通过搜索框，根据自动学习的属性类型（项目名称）快速搜索过滤到相应的工作流，可节省您的时间。登录ModelArts管理控制台，在左侧导航栏选择自动学习，进入自动学习总览页面。在自动学习列表上方的搜索框中，根据您需要的属性类型，例如，名称、状态、项目类型、当前节点、标签等，过滤出相应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。图1 表格显示设置单击“确定”即可按照设置好的显示列进行显示。同时可支持对自动学习项目显示页进行排序，单击表头中的箭头，就可对该列进行排序。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:声音分类的数据要求

声音分类的数据要求音频只支持16bit的WAV格式。支持WAV的所有子格式。单条音频时长应大于1s，大小不能超过4MB。适当增加训练数据，会提升模型的精度。声音分类建议每类音频至少20条，每类音频总时长至少5分钟。建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。训练集的数据质量对于模型的精度有很大影响，建议训练集音频的采样率和采样精度保持一致。标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。音频标注涉及到的标注标签和声音内容只支持中文和英文，不支持小语种。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:数据上传至OBS

数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：如不需要提前上传训练数据，请创建一个空文件夹用于存放工程后期生成的文件。如：“/bucketName/data-cat”。如需要提前上传待标注的音频，请创建一个空文件夹，然后将音频文件保存在该文件夹下，音频的目录结构如：“/bucketName/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的音频，至少有2种以上的分类，每种分类的音频数据数不少20条。

AI开发平台MODELARTS 使用自动学习实现声音分类

云服务器内容精选

使用自动学习实现声音分类

7*24

备案

专业服务

退订

建议反馈

售前咨询热线