声音分类-华为云

AI开发平台MODELARTS-准备声音分类数据:数据上传至OBS

数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：如不需要提前上传训练数据，请创建一个空文件夹用于存放工程后期生成的文件。如：“/bucketName/data-cat”。如需要提前上传待标注的音频，请创建一个空文件夹，然后将音频文件保存在该文件夹下，音频的目录结构如：“/bucketName/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的音频，至少有2种以上的分类，每种分类的音频数据数不少20条。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:声音分类的数据要求

声音分类的数据要求音频只支持16bit的WAV格式。支持WAV的所有子格式。单条音频时长应大于1s，大小不能超过4MB。适当增加训练数据，会提升模型的精度。声音分类建议每类音频至少20条，每类音频总时长至少5分钟。建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。训练集的数据质量对于模型的精度有很大影响，建议训练集音频的采样率和采样精度保持一致。标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。音频标注涉及到的标注标签和声音内容只支持中文和英文，不支持小语种。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-创建声音分类项目:创建项目

创建项目登录ModelArts管理控制台，在左侧导航栏单击“自动学习”，进入新版自动学习页面。在您需要的自动学习项目列表中，单击“创建项目”，进入创建自动学习项目界面。在创建自动学习项目页面，计费模式默认“按需计费”，参考表1填写相应参数。表1 参数说明参数说明 “名称” 项目的名称。名称只能包含数字、字母、下划线和中划线，长度不能超过64位且不能为空。名称请以字母开头。名称不允许重复。 “描述” 对项目的简要描述。 “数据集” 可在右侧下拉框选择已有数据集，或单击“创建数据集”前往新建数据集。已有数据集：在“数据集”右侧的下拉框中选择，仅展示同类型的数据集供选择。创建数据集：前往创建数据集页面创建一个新的数据集。具体操作请参考创建数据集。 “输出路径” 选择自动学习数据输出的统一OBS路径。说明： “输出路径”是存储自动学习在运行过程中所有产物的路径。 “训练规格” 选择自动学习训练节点所使用的资源规格，以实际界面显示为准，将会根据不同的规格计费。说明：只有北京四区域支持限时免费规格。如果您购买了套餐包，可优先选择您对应规格的套餐包，在“配置费用”处会显示您的套餐余量，以及超出的部分如何计费，请您关注，避免造成不必要的资源浪费。单击“创建项目”，声音分类项目创建成功后页面自动跳转到“自动学习工作流”。声音分类项目的工作流，将依次运行如下节点：数据标注：对您的数据进行标注情况确认。数据集版本发布：将已完成确认的数据进行版本发布。数据校验：对您的数据集的数据进行校验，是否存在数据异常。声音分类：将发布好的数据集版本进行训练，生成对应的模型。模型注册：将训练后的结果注册到模型管理中。服务部署：将生成的模型部署为在线服务。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-创建声音分类项目:快速查找创建好的项目

快速查找创建好的项目在自动学习总览页，您可以通过搜索框，根据自动学习的属性类型（项目名称）快速搜索过滤到相应的工作流，可节省您的时间。登录ModelArts管理控制台，在左侧导航栏选择自动学习，进入自动学习总览页面。在自动学习列表上方的搜索框中，根据您需要的属性类型，例如，名称、状态、项目类型、当前节点、标签等，过滤出相应的工作流。单击搜索框右侧的按钮，可选择自动学习的基础设置，需要的显示列。表格内容折行：默认为关闭状态，启用此能力可让表格内容自动折行，禁用此功能可截断文本。操作列：默认为关闭状态，启用此能力可让操作列固定在最后一列永久可见。自定义显示列：默认所有显示项全部勾选，您可以根据实际需要定义您的显示列。图1 表格显示设置单击“确定”即可按照设置好的显示列进行显示。同时可支持对自动学习项目显示页进行排序，单击表头中的箭头，就可对该列进行排序。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-训练声音分类模型:操作步骤

操作步骤在开始训练之前，需要完成数据标注，然后再开始模型的自动训练。在新版自动学习页面，单击项目名称进入运行总览页面，单击数据标注节点的“实例详情”进入数据标注页面，完成数据标注。返回新版自动学习页面，单击数据标注节点的“继续运行”，然后等待工作流按顺序进入训练节点。模型将会自动进入训练，无需人工介入，训练时间相对较长，建议您耐心等待。如果关闭或退出此页面，系统仍然在执行训练操作。在“声音分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成模型的自动训练。训练完成后，您可以单击声音分类节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。表1 评估结果参数说明参数说明 recall：召回率被用户标注为某个分类的所有样本中，模型正确预测为该分类的样本比率，反映模型对正样本的识别能力。 precision：精确率被模型预测为某个分类的所有样本中，模型正确预测的样本比率，反映模型对负样本的区分能力。 accuracy：准确率所有样本中，模型正确预测的样本比率，反映模型对样本整体的识别能力。 f1：F1值 F1值是模型精确率和召回率的加权调和平均，用于评价模型的好坏，当F1较高时说明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的AI应用版本。如第一次训练版本号为“0.0.1”，下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后，再执行模型部署的操作。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:声音分类的数据要求

声音分类的数据要求音频只支持16bit的WAV格式。支持WAV的所有子格式。单条音频时长应大于1s，大小不能超过4MB。适当增加训练数据，会提升模型的精度。声音分类建议每类音频至少20条，每类音频总时长至少5分钟。建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。训练集的数据质量对于模型的精度有很大影响，建议训练集音频的采样率和采样精度保持一致。标注质量对于最终的模型精度有极大的影响，标注过程中尽量不要出现误标情况。音频标注涉及到的标注标签和声音内容只支持中文和英文，不支持小语种。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-准备声音分类数据:数据上传至OBS

数据上传至OBS 在本文档中，采用通过OBS管理控制台将数据上传至OBS桶。上传OBS的文件规范：如不需要提前上传训练数据，请创建一个空文件夹用于存放工程后期生成的文件。如：“/bucketName/data-cat”。如需要提前上传待标注的音频，请创建一个空文件夹，然后将音频文件保存在该文件夹下，音频的目录结构如：“/bucketName/data-cat/cat.wav”。上传OBS的操作步骤：执行如下操作，将数据导入到您的数据集中，以便用于模型训练和构建。登录OBS管理控制台，在ModelArts同一区域内创建桶。如果已存在可用的桶，需确保OBS桶与ModelArts在同一区域。参考上传文件，将本地数据上传至OBS桶中。如果您的数据较多，推荐OBS Browser+上传数据或上传文件夹。上传的数据需满足此类型自动学习项目的数据集要求。在上传数据时，请选择非加密桶进行上传，否则会由于加密桶无法解密导致后期的训练失败。用于训练的音频，至少有2种以上的分类，每种分类的音频数据数不少20条。

AI开发平台MODELARTS 使用自动学习实现声音分类

AI开发平台MODELARTS-数据标注:修改标注

修改标注当数据完成标注后，您还可以进入“已标注”页签，对已标注的数据进行修改。基于音频修改在数据集详情页，单击“已标注”页签，然后在音频列表中选中待修改的音频（选择一个或多个）。在右侧标签信息区域中对标签进行修改。修改标签：在“选中文件标签”区域中，单击操作列的编辑图标，然后在文本框中输入正确的标签名，然后单击确定图标完成修改。删除标签：在“选中文件标签”区域中，单击操作列的删除图标，在弹出的对话框中单击“确定”删除该标签。基于标签修改在数据标注页面，单击“标签管理”页签，在标签管理页，显示全部标签的信息。图3 全部标签的信息

AI开发平台MODELARTS 声音分类

AI开发平台MODELARTS-数据标注:同步或添加音频

同步或添加音频在“自动学习”页面，单击项目名称，进入自动学习“数据标注”页面。声音分类项目创建时，音频来源有两种，通过本地添加或同步OBS中的数据。添加音频：您可以将本地音频快速添加到ModelArts，同时自动上传至创建项目时所选择的OBS路径中。单击“添加音频”，在弹出的对话框中单击“添加音频”并添加。仅支持16bit WAV格式音频文件，单个音频文件不能超过4MB，且单次上传的音频文件总大小不能超过8MB。数据源同步：为了快速获取用户OBS桶中最新音频，单击“数据源同步”，快速将通过OBS上传的音频数据添加到ModelArts。删除音频：您可以依次单击选中音频，或勾选“选择当前页”选中该页面所有音频进行删除操作。所有的删除操作均不可恢复，请谨慎操作。

AI开发平台MODELARTS 声音分类

AI开发平台MODELARTS-数据标注:音频标注

音频标注选择未标注音频。在“数据标注”页面单击“未标注”页签，此页面展示所有未标注的音频数据。依次单击选中待标注的音频，或勾选“选择当前页”选中该页面所有音频，在页面右侧进行标注。图1 音频标注添加标注。先对音频进行播放识别，然后选中音频文件，在右侧“标签”区域，输入“标签名”或从下拉列表中选择已添加的标签，同时可在下拉菜单中选择标签“快捷键”。单击“确定”，完成选中音频的标注操作。图2 声音分类音频标注当目录中所有音频都完成标注后，您可以在“已标注”页签下查看已完成标注的音频，或者通过右侧的“全部标签”列表，了解当前已完成的标签名称和标签数量。

AI开发平台MODELARTS 声音分类

云服务器内容精选

声音分类

7*24

备案

专业服务

退订

建议反馈

售前咨询热线