iXRay网站不良信息云检测服务-
版本: V1.0 | 交付方式: 人工服务 |
适用于: Windows/Linux | 上架日期: 2021-02-24 12:35:00 |
网站不良信息云检测服务,是利用网站不良信息云检测系统,基于网络爬虫技术主动采集获取互联网网站系统内容数据(文本、图片),基于关键字匹配、 自然语言处理 、智能 图像识别 、图像目标检测、样例图片匹配识别等技术手段,帮助客户对互联网网站系统(文本、图片)中含有的色情淫秽、涉政信息、邪教迷信、诈骗赌博等不良信息进行深度检测、准确定位、有效取证、及时告警。
通过检测的方式,满足不良信息监管要求,提升网站系统服务“软质量”,防止不良信息安全隐患,履行社会责任、规避政治风险。
系统功能架构分为三层:网站数据采集、网站数据分析层、网站检测应用。
Ø 网站数据采集
基于用户提供的网站 域名 ,通过网站爬虫技术对用户指定的被监测网站进行URL钻取、网页文本、图片数据采集获取。
Ø 网站数据识别
关键字匹配
基于系统预设的3万多条不良信息识别关键字策略规则,对爬虫获取的网站文本数据进行关键字匹配识别,发现含有不良信息关键字的疑似不良信息网站文本内容。
系统支持自定义关键字策略规则添加。
自然语言处理
系统具备基于深度学习的自然语言处理技术,通过使用非监督数据训练字词向量,提升泛化能力,从而提高文本不良信息的检测发现率,弥补关键字匹配的预设策略不全的缺点,有效识别关键字策略之外的色情淫秽、涉政敏感类文本不良信息。
智能图像识别
系统采用智能图像识别技术,通过大量同类型图片数据持续训练、频繁迭代模拟形成人脑视觉认知对同类型/相似场景(如:色情场景、反动暴恐标志、特定文字、特定人物、特定场景等)的网站图片进行检查,可智能识别同类型/相似场景的图片,从而发现网站中含有的不良信息图片。
图像目标检测
系统采用目标检测技术对图片中出现的旗帜、Logo进行精准识别。目标检测技术可在给定的图片中精准找到物体所在位置,并标注出物体的类别,通过该技术可有效识别网站中含有的特定目标图片(如:违规旗帜、logo)。
样例图片匹配识别
基于系统积累的5千多张涉政敏感样例图片建立的特征库,将采集获取的被监测网站图片与样例图片特征库进行比对分析,从而发现含有涉政敏感的图片内容。系统支持自定义样例图片添加。
Ø 网站检测应用
提供系统的监测策略集中管理、疑似告警人工审计、不良信息集中管理、系统权限集中管理等。