Memory Bench Pioneer

丝美导航 AI技能集 AI智能技能

Memory Bench Pioneer

Memory Bench Pioneer是一款用于AI代理内存基准测试的工具，通过LLM评估和nDCG/MAP/MRR等指标，帮助塑造人工智能的记忆方式。

标签：

链接直达手机查看

Memory Bench Pioneer

Memory Bench Pioneer是什么

Memory Bench Pioneer是一款开源的AI代理内存基准测试工具，适用于研究人员和开发者，用于评估和优化AI代理的记忆能力。

由 globalcaos 开发 | 累计安装 317 次 | 开源协议：MIT-0

Memory Bench Pioneer的主要功能

LLM评估：利用LLM作为评判者，对AI代理的记忆进行评估，提供客观的评估结果。
多指标分析：支持RAR、MRR、nDCG@5、MAP@5、Precision@5、Hit Rate等多个指标，全面评估记忆系统。
消融实验：通过消融实验，隔离和评估特定算法组件的贡献。
匿名化数据收集：收集匿名化的记忆系统统计数据，保护用户隐私。
PR提交：支持将评估结果作为Pull Request提交，便于同行评审和交流。

如何使用Memory Bench Pioneer

安装：下载并解压Memory Bench Pioneer，确保环境满足要求。
评估检索质量：运行rate.py脚本，使用LLM作为评判者进行标准测试集的评估。
收集统计数据：运行collect.py脚本，收集匿名化的记忆系统统计数据。
提交PR：运行submit.sh脚本，将评估结果作为Pull Request提交。
审查代码：在运行代码之前，请先审查代码以确保安全。

Memory Bench Pioneer的项目地址

项目官网：https://clawhub.ai/globalcaos/memory-bench-pioneer

Memory Bench Pioneer的应用场景

AI代理记忆能力评估
AI代理记忆系统优化
AI代理记忆能力比较
AI代理记忆系统研究
AI代理记忆能力开发

相关导航

小花自我迭代 (HuaNiu Enhanced)

小花自我迭代技能，集成OpenClaw、MEMORY.md等，优化国内部署，助力个人技能提升。

飞书周报

飞书周报，自动整合飞书聊天记录和daily memory日志，生成个性化工作总结。

X1 Vault Memory

X1 Vault Memory：使用AES-256-GCM加密，将OpenClaw代理内存备份至IPFS，并通过X1区块链CID锚定，确保数据安全与可恢复。

White Stone Memory

白石记忆系统是一款基于知识分类的记忆管理系统，支持常识记忆、项目记忆、错题本、每日回顾和任务追踪，采用按需加载机制，有效避免记忆污染。

WAL Memory

WAL Memory是一款用于OpenClaw代理的会话崩溃和压缩恢复工具，采用双文件WAL系统，实现持久化内存。

Vta Memory

Vta Memory是一款为AI代理提供奖励和动机系统的工具，通过模拟多巴胺的渴望机制，提升AI代理的行为动机。

Viking Memory

Viking Memory，基于OpenViking的长期记忆系统，提供语义检索功能，用于存储和检索用户偏好、历史对话和重要信息。

vector-memory

基于语义嵌入的智能内存搜索工具，自动向量回退，无需配置，安装后即可使用。

Vector Memory Hack

向量内存黑客是一款基于TF-IDF和SQLite的轻量级语义搜索工具，专为AI代理内存文件设计，提供快速、准确的上下文检索。

Vector Memory (Windows) for OpenClaw

为OpenClaw提供完整的内存解决方案，包括语义内存、决策内存和内存卫生工作流程。

Vanar Neutron Memory

Vanar Neutron Memory：通过语义搜索保存和召回智能体记忆，支持跨会话上下文持久化。

triple-memory-baidu-embedding

结合百度嵌入、Git-Notes和文件搜索，提供跨会话持久上下文和本地隐私保护的完整记忆系统。

暂无评论