检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架: DeepSpeed和Accelerate都是针对深度学习训练加速的工具,但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架,主要针对大规模模型和大规模数据集的训练。D
修改标签:在需要修改的标签的“操作”列,单击“修改”,输入修改后的标签,单击“确定”即可。 删除标签:选择对应的标签,单击操作列的“删除”,在弹出的“删除标签”对话框中单击“确定”即可删除对应的标签。 删除后无法再恢复,请谨慎操作。 继续运行 完成数据的确认之后,返回自动学习的页面,在数据
修改已标注的数据 针对“已标注”的文本数据,仅支持删除此文本对象的标签。在“已标注”页签下,在标签名称区域单击标签右上角的叉号,即可删除此文本对象的标签。标签删除后,此文本对象将被呈现至“未标注”页签下。 图3 删除已标注文本的标签 修改标签 针对文本分类的自动学习项目,项目创
表1 预测结果中的参数说明 参数 说明 predicted_label 表示图片预测的标签。 scores 表示Top5标签的预测置信度。 由于“运行中”的在线服务将持续耗费资源,如果不需再使用此在线服务,建议在“在线服务”的操作列单击“更多>停止”,避免产生不必要的费用。如果需要继续使用此服务,可单击“启动”恢复。
每一类数据尽量多,尽量均衡。期望获得良好效果,图像分类项目中,至少有两种以上的分类,每种分类的样本不少于20张。 为了保证模型的预测准确度,训练样本跟真实使用场景尽量相似。 为保证模型的泛化能力,数据集尽量覆盖可能出现的各种场景。 数据上传至OBS 在本文档中,采用通过OBS管理控制台将数据上传至OBS桶。
本地麦克风只有一个,不支持多个进程设置不同的录音参数,先设置的生效。 麦克风录音接口和播放音频文件的接口不能同时使用。 返回值 音频数据采集器。 如果创建失败则抛出一个CreateError。开发者可以在查看技能日志输出。 父主题: 音频输入模块
单击选择“图像分类”创建项目。完成参数填写。 名称:自定义您的项目名称。 描述:自定义描述您的项目详情,例如垃圾分类。 数据集:下拉选择已下载的数据集(步骤2中已成功导入的数据集,默认为下拉数据集列表中的第一个数据集)。 输出路径:选择您步骤1创建好的OBS文件夹下的路径,用来存储训练模型等相关文件。
【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告 华为云计划于2024/12/06 00:00(北京时间)将AI开发平台ModelArts自动学习模块的文本分类功能正式下线。 下线范围 下线Region:华为云全部Region。 下线影响 ModelArts自动学习-文本分类正式下线后,
使用自动学习实现图像分类 准备图像分类数据 创建图像分类项目 标注图像分类数据 训练图像分类模型 部署图像分类服务 父主题: 使用自动学习实现零代码AI开发
使用自动学习实现声音分类 准备声音分类数据 创建声音分类项目 标注声音分类数据 训练声音分类模型 部署声音分类服务 父主题: 使用自动学习实现零代码AI开发
使用自动学习实现文本分类 准备文本分类数据 创建文本分类项目 标注文本分类数据 训练文本分类模型 部署文本分类服务 父主题: 使用自动学习实现零代码AI开发
置。 音频码率值越大,音质越好,占用带宽越大。 音频采样率 当“音频流格式”为“OPUS”、“AAC”时可以设置。 录音设备在一秒钟内对声音信号的采样次数,采样率越高,声音的还原就越真实越自然。 环境噪声过滤 将周围环境的噪声减小,使有效声音更清晰。 音频自动增益 提升音频质量。
图片/音频标注介绍 图片/音频标注是为数据工程师、数据科学家等提供的辅助标注工具。提供界面化数据查看、单点数据标注、保存标注结果、标注结果发布数据集等功能。可准确、高效、安全地完成各类型数据的标注任务,为客户提供专业的数据标注服务能力,助力客户高效开展算法模型训练与机器学习,快速提高AI领域竞争力。
在配置中,设置音频组件的音频地址、是否自动播放和是否开启控制条等。 图4 音频轮播设置 音频 > 音频地址:输入音频的存放地址,仅支持MP3、OGG和WAV格式的音频。 播放 自动播放:开启后,在预览页面或发布后的页面中,会自动播放音频内容。 循环播放:开启后,在预览页面或发布后的页面中,视频播放完成后会再次从头开始播放。
音频提取 功能介绍 本接口为异步接口,创建音频提取任务下发成功后会返回asset_id和提取的audio_asset_id,但此时音频提取任务并没有立即完成,可通过消息订阅界面配置的音频提取完成事件来获取音频提取任务完成与否。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API
音频自采集和音频自渲染 功能介绍 实时音频传输过程中,HWRtcEngine SDK 通常会启动默认的音频模块进行采集和渲染。在以下场景中,您可能会发现默认的音频模块无法满足开发需求: app中已有自己的音频模块。 需要使用自定义的采集或播放处理。 某些音频采集设备被系统独占。 接口调用流程
该解决方案基于华为云内容审核 Moderation的音频审核技术构建,可自动对上传到对象存储服务 OBS的音频进行审核,帮助用户快速识别音频是否包含涉黄、广告、涉政涉暴、涉政敏感人物等违规内容。适用于游戏语音审核、线上会议语音审核、直播间、多人聊天室等场合,帮助维护健康、和谐的语音交流场景。
创建图像分类自动学习项目并完成图片标注,训练按钮显示灰色,无法开始训练? 图像分类项目,图片标注至少需要两个类别,且每个类别至少5张图片,才可以开始自动训练。 父主题: 模型训练
ModelArts自动学习与ModelArts PRO的区别 ModelArts自动学习,提供了AI初学者,零编码、零AI基础情况下,可使用自动学习功能,开发用于图像分类、物体检测、预测分析、文本分类、声音分类等场景的模型。 而ModelArts PRO是一款为企业级AI应用打造的专业开发套
练失败。 声音分类对数据集的要求 音频只支持16bit的WAV格式。支持WAV的所有子格式。 单条音频时长应大于1s,大小不能超过4MB。 适当增加训练数据,会提升模型的精度。声音分类建议每类音频至少20条,每类音频总时长至少5分钟。 建议训练数据和真实识别场景的声音保持一致并且每类的音频尽量覆盖真实环境的所有场景。