产品功能
-
语料安全评估
平台根据《生成式人工智能服务安全基本要求》所规定的五个维度,提供31个安全风险点维护更新敏感词词典;使用全覆盖的敏感词词典,对生成式人工智能的训练语料库、模型生成内容进行检查,以确保安全性符合国家法律规定。 -
生成内容检查
平台通过问询提问、假设提问、伪装提问三种提问问题绕过生成式大模型的逻辑防火墙,通过逻辑诱导让大模型回答违规内容;基础组成包括角色、主体、事件、行为、问询问题、诱导问题、伪装问题。 -
拒答检查
平台根据项目积累或者厂商提供的拒答语料内容库,对测试问题大模型的生成内容进行检查;根据拒答语句统计模块对其应拒答率和非拒答率的统计,以检测其是否满足《生成式人工智能服务安全基本要求》规定要求。 -
图谱安全检查
平台根据《生成式人工智能服务安全基本要求》规定,以31个安全风险点准备相应应拒答和非拒答图片提供图片大模型安全检查服务;判断其大模型在应拒绝图片(反向图片)和非拒答(正向图片)时的拒答率是否满足《要求》的相关规定。
产品优势
检测精准
内容识别精度远高于字段标识识别,支持灵活测试题库配置,实时过滤问题内容。全面覆盖
通过维护关键词库和生成内容测试题库/拒答测试题库,确保覆盖所有检查内容,杜绝潜在风险。灵活组合
支持角色、主体、事件、行为、问询、诱导、伪装等组成测试问题,多维度对人工智能模型进行安全检查。
典型应用场景
- 1
- 2
- 3