Stardust数据标注系统(HCS版)-
文本NLP标注:全国最大体量新闻NLP标注
一、需求:
国家新闻稿件文本标注
二、项目难点:
1)NLP自然语言标注内容涉猎广,难度大。需要平台对于文本内容有精确的区域划分及辨别功能
2)项目前期,标注需求不够清晰,缺乏完善的标注规则体系;文章篇幅长,大标签数量22个,累积标签和选项达70-80个
3)文章类型多,场景多,包含9大场景,数据形式多,包含文字、图片和视频等
三、 解决方案 :
1)对于不够完善的标注规则体系,项目配置的专属PM(项目经理),即时反馈标注过程遇到的标注问题并提供多个解决方案,推动优化完善标注规则体系
2)对于复杂的标注场景与需求,星尘系统带有的预标注与自动质检大大地提高了标注的效率与质量
3)平台根据标注内容自助设立区域标签,协助标注员辨别区分文本内容
某国内自动驾驶解决方案公司
一、需求
1)3D点云标注工具,要求支持3D点云图像标注、2D&3D融合标注、点云语义分割等标注
2)2D图像标注工具,支持2D图像的矩形框、点、线、多边形、立体框等标注
3)项目管理功能,支持全面的项目及项目人员管理功能
4)辅助算法,配置辅助质检及相关预标注算法
二、客户痛点
1)自研标注平台耗费时间长、资源多,且由于是定制化开发的平台,后续可能不适用于其它项目的标注
2)自研标注平台需要足够多的项目进行打磨,平台成熟周期长
3)自研标注平台的标注效率及标注质量不好保证
三、解决方案
1)星尘根据客户的实际需求,为客户部署标注平台以及对应需求模块的标注工具
2)星尘为客户提供一套成熟的标注平台及对应的项目管理、人员管理等功能
3)通过配置辅助算法质检、辅助算法预标注达到提高标注效率的目的,同时结合平台的质量管理体系,对数据进行多层质检,保证输出的数据质量
视频连续帧标注:某知名国外高校研究所
一、需求:
1)视频抽帧
2)连续帧图像清晰
3)连续帧图像标注:根据动作分类选择要标注的人物、物体、关系和元动作,使用词语表中的字词进行标注,选择的词要尽量准确贴切
二、项目难点:
1)视频抽帧及数据清洗比较耗时
2)视频数据多数为影视剧图像,普通算法辅助效果不显著
3)字词表中词汇较多,主观判断性比较强
三、解决方案:
1)针对影视剧类型数据,适配辅助算法,帮助数据进行预标注及质检
2)将第一帧的图像数据标注好以后,通过算法辅助将后面的连续帧数据进行预标注,标注员只需要针对后续数据进行微调
3)平台针对易错点可实时提示