检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
敏感数据识别概述 敏感数据自动识别分类,从海量数据中自动发现并分析敏感数据使用情况,基于数据识别引擎,对其储存结构化数据(RDS、DWS等)和非结构化数据(OBS)进行扫描、分类、分级,解决数据“盲点”,以此做进一步安全防护。
敏感检测 在数据服务首页左侧导航,选择“首页>我的数据集”。 在“我的数据集”页签单击新增的数据集。 单击“应用数据集 > 安全管理 > 敏感检测”,进入“敏感检测”界面。 配置敏感检测任务参数,如图1所示。 参数说明如下所示: 任务名称:敏感检测任务的自定义名称。
配置Elasticsearch集群自定义词库 Elasticsearch集群词库介绍 配置和使用Elasticsearch集群的自定义词库 父主题: 管理Elasticsearch集群
该API属于CSS服务,描述: 该接口用于删除自定义词库。接口URL: "/v1.0/{project_id}/clusters/{cluster_id}/poisson_words"
删除敏感词 场景描述 删除敏感词的接口。
新增敏感词 场景描述 新增敏感词的接口。
(DFA作为比较常用的过滤手段,建议大家掌握一下~) 最后附上敏感词词库: https://github.com/qloog/sensitive_words 以上,便是今天的内容,希望大家喜欢,欢迎「转发」或者点击「在看」支持,谢谢各位。
敏感数据识别任务 新建敏感数据识别任务 立即启动识别任务 管理识别任务列表 识别结果 父主题: 敏感数据识别
敏感数据识别配置 新增识别模板 管理识别模板 新建自定义规则 编辑规则 查看内置规则 新建分级 管理级别 父主题: 敏感数据识别
根据敏感词分类的唯一标识取得分类下敏感词列表 场景描述 根据敏感词分类的唯一标识取得分类下敏感词列表的接口。
识别文本内容是否有敏感内容,事件类型为评论,命中的自定义词库名称为custom_xxx,检测时使用的自定义白名单词库列表为custom_xxx,检测文本为asdfasdfasdf。
更新敏感词 场景描述 更新敏感词的接口。
内容审核对接了华为云的Moderation服务,它具备文本、图像、视频的审核能力,业务只要定期的更新敏感词库即可。除此之外,还有规范性检查,包括404死链、TDK信息、货币单位等,采用的方案主要是爬虫服务和规则引擎。
更新敏感词分类 场景描述 更新敏感词分类的接口。
创建敏感词分类 场景描述 创建敏感词分类的接口。
删除敏感词分类 场景描述 删除敏感词分类的接口。
1、什么是pkuseg pkuseg 是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。github地址: https://github.com/lancopku/pkuseg-python 2、特点 多领域分词。不同于以往的通用中文分词工具,此工具包同时致力于为不同领域的数据提供个性化的预训练模型
查看内置规则 数据安全中心根据行业敏感信息内置了包含图片敏感信息、个人敏感信息、企业敏感信息等七类规则,具体请参见DSC支持的内置识别规则有哪些? 使用约束 营业执照照片识别目前因为OCR服务只支持部分区域,所以只有部分区域支持识别,支持的区域请参见OCR支持区域。
在左侧导航树中选择“敏感数据识别 > 识别配置”,进入识别模板页签。 选择“识别规则”页签,进入识别规则界面,如图1所示。 图1 识别规则列表 在目标规则操作列单击“编辑”查看并修改规则。内置规则支持修改的参数有“添加到模板”。 父主题: 敏感数据识别配置
取得敏感词列表 场景描述 取得敏感词列表的接口。