研究:LLM的prefilling功能,反而成为了它的越狱漏洞!
一项最新研究揭示大语言模型中的预填充功能成为绕过安全限制的最有效攻击工具,成功率高达99.82%。研究表明,预填充技术不仅用于提高输出质量,反而可能破坏AI的安全边界。
一项最新研究揭示大语言模型中的预填充功能成为绕过安全限制的最有效攻击工具,成功率高达99.82%。研究表明,预填充技术不仅用于提高输出质量,反而可能破坏AI的安全边界。
今天分享的DroidRun是一个基于大语言模型的开源框架,用于通过自然语言命令控制Android设备。它支持多种LLM,并结合DroidRun Portal应用实现自动化操作,如购物助手、社交媒体发布等。
该研究系统地分析了大语言模型在决策场景中的表现次优原因,并提出通过强化学习对自动生成的思维链推理过程进行微调,以缓解贪婪性、频率偏差和知行差距问题。
上海交通大学团队发布论文《A Survey of AI Agent Protocols》,提出二维分类体系和七大维度评估框架,旨在解决智能体间协议碎片化问题。该研究通过真实案例分析展示了不同协议在旅行规划中的应用差异,并对未来AI智能体协议的发展进行了展望。
字节跳动启动2026届Top Seed校招计划,目标招募约30名顶尖博士,涵盖大语言模型、多模态生成等关键领域。此举揭示了对大模型时代底层基础设施的争夺战。
科学领域正经历一场静默的革命。传统的特征工程、模型训练与迭代优化流程,正被智能化的研发助手所改变。