语音识别
录音文件识别产品特性
高识别率 基于深度学习技术,对特定领域场景和语料进行优化, 语音识别 率达到业界领先 前沿技术 使用工业界成熟的算法,结合语音识别学术界最新研究成果,为企业提供独特竞争力优势 可定制化 针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确 支持热词 针对专业词汇,支持上传至热词表,增加专业词汇的语音识别准确率 多模型多音频格式 提供对话、银行、保险等多种领域模型,支持8种以上音频格式的转写,适配场景广泛 支持质检参数分析 针对8k采样率模型,支持话者分离、情绪检测、语速检测等功能
视频标签视频推荐
视频推荐 基于对视频的场景分类、人物识别、语音识别、 文字识别 等分析,形成层次化的分类标签,进行个性化视频推荐 优势 多维度识别 综合图像、语音、文字、人脸等信息,标签识别更加准确 识别准确 采用标签排序学习算法与卷积神经网络算法,标签识别准确度高 标签可定制 只需提供少量视频与对应标签,便可以按需定制标签类别、层次体系 建议搭配使用: 对象存储服务 OBS
视频标签视频搜索
视频搜索 基于对视频的场景分类、人物识别、语音识别、文字识别等分析,形成层次化的分类标签,支撑准确高效的视频搜索,提升搜索体验 优势 多维度识别 综合图像、语音、文字、人脸等信息,标签识别更加准确 识别准确 采用标签排序学习算法与卷积神经网络算法,标签识别准确度高 标签可定制 只需提供少量视频与对应标签,便可以按需定制标签类别、层次体系 建议搭配使用: 对象存储 服务 OBS
一句话识别产品特性
效果出众 使用深度学习技术,语音识别准确率高,在业界具有一定的技术优势 稳定可靠 成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验 简单易用 提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出 语音识别 实时将语音转换成文字,一次性上传整个音频,能快速返回识别结果。 语言支持 支持中文普通话、带方言口音的普通话以及方言,方言当前支持四川话、粤语和上海话识别。 多语音格式支持 支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等