《促销》书籍解读

文章正文
发布时间:2025-08-27 23:05

大型语言模型(LLM)智能体在各类现实应用中日益普及。为辅助决策,它们会将用户与智能体之间的私人交互信息存储在记忆模块中,这为LLM智能体带来了新的隐私风险。本研究在黑盒环境下,针对我们提出的记忆提取攻击(MEXTRA),系统地探究了LLM智能体的脆弱性。为从记忆中提取私人信息,我们提出了一种有效的攻击提示设计方案,以及一种基于对LLM智能体不同认知程度的自动提示生成方法。在两个具有代表性的智能体上开展的实验,验证了MEXTRA攻击的有效性。

首页
评论
分享
Top