guardian-wall

丝美导航 AI技能集安全合规技能

guardian-wall

守护墙：智能防御提示注入，保障内容安全。

标签：

链接直达手机查看

guardian-wall

guardian-wall是什么

守护墙是一款用于净化外部内容并防御提示注入（PI）和间接提示注入（IPI）的安全工具，适用于处理来自互联网、用户上传的文件或任何外部来源的未信任文本。

开源协议：MIT-0

guardian-wall的主要功能

内容净化：移除非打印字符、零宽空格并检测常见注入模式，确保输入文本安全。
检测与审计：自动检测可疑模式，高风险内容启动子代理审计，保障内容安全。
沙盒包装：使用随机或特定哈希的唯一XML标签包装外部内容，防止恶意注入。
禁止模式检测：识别并标记高风险模式，如“忽略所有之前的指令”等，防止系统被操纵。
隔离使用：使用独特分隔符隔离净化后的文本，确保安全使用。

如何使用guardian-wall

净化输入：在处理外部文本前，运行 `scripts/sanitize.py` 清理文本。
检测可疑模式：系统自动检测文本中的可疑模式，并通知用户。
启动审计：对于高风险内容，启动子代理进行审计。
沙盒包装：使用随机或特定哈希的唯一XML标签包装外部内容。
隔离使用：使用分隔符隔离净化后的文本，确保安全使用。

guardian-wall的应用场景

处理来自互联网的未信任文本，如新闻、评论等。
审核用户上传的文件，如文档、图片等。
保护系统免受恶意指令的攻击。
确保在线服务内容的安全，如论坛、博客等。
用于企业内部信息处理，保障信息安全。

相关导航

guardian-wall

守护墙：智能防御提示注入，保障内容安全。

暂无评论