检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在左侧菜单栏中选择“设置>自定义词库 V2”,在“自定义词库 V2”页面单击“白词库”页签下的“创建词库”按钮,会弹出“创建词库”窗口。 图1 创建词库 在窗口中填写词库名称,输入新增的白名单关键词。单击“确定”,完成词库的创建。
配置自定义词库(可选) 使用文本内容审核服务前,您可以配置自定义白名单词库或自定义黑名单词库,来帮助您过滤和检测指定文本内容。 配置自定义词库 V2请看具体操作。 配置自定义词库 V3请看具体操作。
背景信息 配置自定义词库需要先开通文本内容审核服务,详请参见申请服务。 配置后可以免费使用自定义词库。 一个账户最多支持创建20个自定义词库。 创建自定义词库 白名单词库的处理建议选择“通过”,黑名单词库的处理建议选择“违规”或“疑似”。
使用文本内容审核时,您可以配置自定义词库来过滤和检测指定文本内容。当前仅支持中文内容审核。 自定义白名单词库配置 进行白名单词库配置,可以不检测白名单词库中配置的内容。 自定义黑名单词库 黑名单词库的名称指定给categories就是设置自定义的场景。
block:包含敏感信息,不通过。 pass:不包含敏感信息,通过。 review:需要人工复查。 detail Object 返回的相关检测结果详细信息。 porn:涉黄敏感词列表。 ad:广告敏感词列表。 abuse:辱骂敏感词列表。
拒绝数:指的是block总数,即文本中包含敏感信息,审核不通过的次数。 疑似数:指的是review总数,即人工复查审核的次数。 通过数:指的是pass总数,即通过审核的次数。 数据趋势:显示您设置的这段时间范围内,总数,拒绝数,疑似数和通过数的变化趋势。
拒绝数:指的是block总数,即文本中包含敏感信息,审核不通过的次数。 疑似数:指的是review总数,即人工复查审核的次数。 通过数:指的是pass总数,即通过审核的次数。 数据趋势:显示您设置的这段时间范围内,总数,拒绝数,疑似数和通过数的变化趋势。
识别文本内容是否有敏感内容,事件类型为评论,命中的自定义词库名称为custom_xxx,检测时使用的自定义白名单词库列表为custom_xxx,检测文本为asdfasdfasdf。
white_glossary_names 否 Array of strings 检测时使用的自定义白名单词库列表。 详情请看配置自定义词库 V3。
当前支持的场景有系统场景和用户自定义场景: 系统场景为: qr_code:二维码 porn:涉黄 ad:广告 abuse:辱骂 contraband:违禁品 用户自定义场景为:自定义黑名单词库。 说明: 自定义词库的创建和使用请参见配置自定义词库 V2。
场景优势如下: 快速迭代:持续快速的迭代文本词库,及时识别新型不合规内容。 处理速度快:处理速度小于0.1秒。 弹幕审核 实时检测弹幕文本、保证网络直播间内容安全,降低业务违规风险。 场景优势如下: 海量词库:内置海量词库,支持各种匹配规则。
当前支持的场景有系统场景和用户自定义场景: 系统场景为: qr_code:二维码 porn:涉黄 ad:广告 abuse:辱骂 contraband:违禁品 用户自定义场景为:自定义黑名单词库。 说明: 自定义词库的创建和使用请参见配置自定义词库 V2。
glossary_name String 命中的自定义词库名称。命中自定义词库时,才会返回当前字段。
准备数据 配置自定义词库(可选) 自定义白名单词库/自定义黑名单词库 使用文本内容审核服务,您可以配置自定义白名单词库或自定义黑名单词库,来帮助您过滤和检测指定文本内容。
附录 状态码 错误码 配置OBS访问权限 配置自定义词库 V2 配置自定义词库 V3 配置审核规则 策略管理 获取项目ID 获取账号名和账号ID
block:包含敏感信息,不通过 pass:不包含敏感信息,通过 review:需要人工复检 说明: 当同时检测多个场景时,suggestion的值以最可能包含敏感信息的场景为准。
关联自定义词库配置 此处可关联自定义词库,审核时词库会生效。 对于不使用行业模板创建的bizType,音频审核和视频中的音频审核暂不支持违禁(ban)场景的配置。如果音频审核和视频中的音频审核只因违禁(ban)场景而违规,审核结果会通过(pass)。
当前支持的场景有系统场景和用户自定义场景: 系统场景为: qr_code:二维码 porn:涉黄 ad:广告 abuse:辱骂 contraband:违禁品 用户自定义场景为:自定义黑名单词库。 说明: 自定义词库的创建和使用请参见配置自定义词库 V2。
文本审核不支持word文件直接上传,只能通过调用API接口的方式,分析并识别用户上传的文本内容是否有敏感内容,并将识别结果返回给您。调用方法请参考《内容审核-文本入门》。 建议您先把word文件中字符串提取出来 ,然后分批、分字段调用服务的API接口,进行文本审核。
block:包含敏感信息,不通过 review:需要人工复检 pass:不包含敏感信息,通过 details Array of details objects 审核详情。