视频标签(简称VCT),基于深度学习对视频进行场景分类、人物识别、 语音识别 、 文字识别 等多维度分析,形成层次化的分类标签。
功能描述
场景概念识别
基于对视频中的场景信息的分析,输出丰富而准确的概念、场景标签
人物识别
基于对视频中的人物信息的分析,输出准确的人物标签
视频OCR
识别视频中出现的文字内容,包括字幕、弹幕、以及部分自然场景文字和艺术字等
产品优势
识别准确
采用标签排序学习算法与卷积神经网络算法,识别精度高,支持实时识别与检测
简单易用
提供符合RESTful的API访问接口,使用方便,用户的业务系统可快速集成
层次标签
层次化标签库完善,支持同时输出通用标签与垂直领域细粒度标签,丰富标签应用场景
多维分析
从声音、动作、图像、文字等多维度分析视频,深度理解视频内容,输出结果更加准确
应用场景
1.视频搜索
基于对视频的场景分类、人物识别、语音识别、文字识别等分析,形成层次化的分类标签,支撑准确高效的视频搜索,提升搜索体验
优势
多维度识别
综合图像、语音、文字、人脸等信息,标签识别更加准确
识别准确
采用标签排序学习算法与卷积神经网络算法,标签识别准确度高
标签可定制
只需提供少量视频与对应标签,便可以按需定制标签类别、层次体系
2.视频推荐
基于对视频的场景分类、人物识别、语音识别、文字识别等分析,形成层次化的分类标签,进行个性化视频推荐
优势
多维度识别
综合图像、语音、文字、人脸等信息,标签识别更加准确
识别准确
采用标签排序学习算法与卷积神经网络算法,标签识别准确度高
标签可定制
只需提供少量视频与对应标签,便可以按需定制标签类别、层次体系