
guardian-wall是什么
守护墙是一款用于净化外部内容并防御提示注入(PI)和间接提示注入(IPI)的安全工具,适用于处理来自互联网、用户上传的文件或任何外部来源的未信任文本。
开源协议:MIT-0
guardian-wall的主要功能
- 内容净化:移除非打印字符、零宽空格并检测常见注入模式,确保输入文本安全。
- 检测与审计:自动检测可疑模式,高风险内容启动子代理审计,保障内容安全。
- 沙盒包装:使用随机或特定哈希的唯一XML标签包装外部内容,防止恶意注入。
- 禁止模式检测:识别并标记高风险模式,如“忽略所有之前的指令”等,防止系统被操纵。
- 隔离使用:使用独特分隔符隔离净化后的文本,确保安全使用。
如何使用guardian-wall
- 净化输入:在处理外部文本前,运行 `scripts/sanitize.py` 清理文本。
- 检测可疑模式:系统自动检测文本中的可疑模式,并通知用户。
- 启动审计:对于高风险内容,启动子代理进行审计。
- 沙盒包装:使用随机或特定哈希的唯一XML标签包装外部内容。
- 隔离使用:使用分隔符隔离净化后的文本,确保安全使用。
guardian-wall的应用场景
- 处理来自互联网的未信任文本,如新闻、评论等。
- 审核用户上传的文件,如文档、图片等。
- 保护系统免受恶意指令的攻击。
- 确保在线服务内容的安全,如论坛、博客等。
- 用于企业内部信息处理,保障信息安全。
渝公网安备50011302222466号
暂无评论