丝美导航 AI技能集 安全合规技能

guardian-wall

守护墙:智能防御提示注入,保障内容安全。

标签:
分享到:

guardian-wall

guardian-wall是什么

守护墙是一款用于净化外部内容并防御提示注入(PI)和间接提示注入(IPI)的安全工具,适用于处理来自互联网、用户上传的文件或任何外部来源的未信任文本。

开源协议:MIT-0

guardian-wall的主要功能

  • 内容净化:移除非打印字符、零宽空格并检测常见注入模式,确保输入文本安全。
  • 检测与审计:自动检测可疑模式,高风险内容启动子代理审计,保障内容安全。
  • 沙盒包装:使用随机或特定哈希的唯一XML标签包装外部内容,防止恶意注入。
  • 禁止模式检测:识别并标记高风险模式,如“忽略所有之前的指令”等,防止系统被操纵。
  • 隔离使用:使用独特分隔符隔离净化后的文本,确保安全使用。

如何使用guardian-wall

  • 净化输入:在处理外部文本前,运行 `scripts/sanitize.py` 清理文本。
  • 检测可疑模式:系统自动检测文本中的可疑模式,并通知用户。
  • 启动审计:对于高风险内容,启动子代理进行审计。
  • 沙盒包装:使用随机或特定哈希的唯一XML标签包装外部内容。
  • 隔离使用:使用分隔符隔离净化后的文本,确保安全使用。

guardian-wall的应用场景

  • 处理来自互联网的未信任文本,如新闻、评论等。
  • 审核用户上传的文件,如文档、图片等。
  • 保护系统免受恶意指令的攻击。
  • 确保在线服务内容的安全,如论坛、博客等。
  • 用于企业内部信息处理,保障信息安全。

相关导航