检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置自定义词库(可选) 使用文本内容审核服务前,您可以配置自定义白名单词库或自定义黑名单词库,来帮助您过滤和检测指定文本内容。 配置自定义词库 V3请看具体操作。
背景信息 配置自定义词库需要先开通文本内容审核服务,详请参见申请服务。 配置后可以免费使用自定义词库。 一个账户最多支持创建20个自定义词库。 创建自定义词库 白名单词库的处理建议选择“通过”,黑名单词库的处理建议选择“违规”或“疑似”。
使用文本内容审核时,您可以配置自定义词库来过滤和检测指定文本内容。当前仅支持中文内容审核。 自定义白名单词库配置 进行白名单词库配置,可以不检测白名单词库中配置的内容。 自定义黑名单词库 黑名单词库的名称指定给glossary_names就是设置自定义的场景。
拒绝数:指的是block总数,即文本中包含敏感信息,审核不通过的次数。 疑似数:指的是review总数,即人工复查审核的次数。 通过数:指的是pass总数,即通过审核的次数。 数据趋势:显示您设置的这段时间范围内,总数,拒绝数,疑似数和通过数的变化趋势。
步骤二:配置自定义词库 文本内容审核服务可支持用户配置自定义白名单词库和自定义黑名单词库进行文本审核。 具体步骤请参考创建自定义词库。 步骤三:配置环境 您可以基于内容审核SDK通过编写代码的方式调用内容审核-文本API。在使用SDK和调用API时您需要进行环境配置。
识别文本内容是否有敏感内容,事件类型为评论,命中的自定义词库名称为custom_xxx,检测时使用的自定义白名单词库列表为custom_xxx,检测文本为asdfasdfasdf。
white_glossary_names 否 Array of strings 检测时使用的自定义白名单词库列表。 详情请看配置自定义词库 V3。
文本审核不支持word文件直接上传,只能通过调用API接口的方式,分析并识别用户上传的文本内容是否有敏感内容,并将识别结果返回给您。调用方法请参考《内容审核-文本入门》。 建议您先把word文件中字符串提取出来 ,然后分批、分字段调用服务的API接口,进行文本审核。
glossary_name String 命中的自定义词库名称。命中自定义词库时,才会返回当前字段。
拒绝数:指的是block总数,即文本中包含敏感信息,审核不通过的次数。 疑似数:指的是review总数,即人工复查审核的次数。 通过数:指的是pass总数,即通过审核的次数。 数据趋势:显示您设置的这段时间范围内,总数,拒绝数,疑似数和通过数的变化趋势。
block:包含敏感信息,不通过 pass:不包含敏感信息,通过 review:需要人工复检 details Array of details objects 审核详情。 audio_text String 音频文本内容。
内容审核-文本 文本内容审核,采用人工智能文本检测技术有效识别涉黄、广告、辱骂、违禁品文本内容,提供定制化的文本敏感内容审核方案。
关联自定义词库配置 此处可关联自定义词库,审核时词库会生效。 对于不使用行业模板创建的bizType,音频审核和视频中的音频审核暂不支持违禁(ban)场景的配置。如果音频审核和视频中的音频审核只因违禁(ban)场景而违规,审核结果会通过(pass)。
block:包含敏感信息,不通过 review:需要人工复检 pass:不包含敏感信息,通过 image_detail Array of image_detail objects 图像审核详情。
block:包含敏感信息,不通过 review:需要人工复检 pass:不包含敏感信息,通过 details Array of details objects 审核详情。
场景优势如下: 快速迭代:持续快速的迭代文本词库,及时识别新型不合规内容。 处理速度快:处理速度小于0.1秒。 弹幕审核 实时检测弹幕文本、保证网络直播间内容安全,降低业务违规风险。 场景优势如下: 海量词库:内置海量词库,支持各种匹配规则。
文本审核 表1 文本审核接口说明 API 说明 文本内容审核 分析并识别用户上传的文本内容是否有敏感内容(如色情等),并将识别结果返回给用户。
附录 状态码 错误码 配置OBS访问权限 配置自定义词库 V3 策略管理 获取项目ID 获取账号名和账号ID
准备数据 配置自定义词库(可选) 自定义白名单词库/自定义黑名单词库 使用文本内容审核服务,您可以配置自定义白名单词库或自定义黑名单词库,来帮助您过滤和检测指定文本内容。
拒绝数:指的是block总数,即文本中包含敏感信息,审核不通过的次数。 疑似数:指的是review总数,即人工复查审核的次数。 通过数:指的是pass总数,即通过审核的次数。 数据趋势:显示您设置的这段时间范围内,总数,拒绝数,疑似数和通过数的变化趋势。