将越狱问题转换为求解逻辑推理题:「滥用」推理能力让LLM实现自我越狱
大语言模型在推理任务中表现出色,但可能被恶意利用。来自北航等团队提出RACE框架,通过推理增强对话攻击模型的安全对齐机制。研究揭示了潜在威胁,并提出了防御策略。
大语言模型在推理任务中表现出色,但可能被恶意利用。来自北航等团队提出RACE框架,通过推理增强对话攻击模型的安全对齐机制。研究揭示了潜在威胁,并提出了防御策略。
论文介绍了通用灵巧操控的研究,通过统一的轨迹跟踪任务表示和结合RL与IL的方法训练通用轨迹跟踪器,实现在多种复杂任务上的表现。
AMD 发布了最新的 Radeon RX 9000 系列显卡,配备了强大的 RDNA 4 架构和高带宽内存,旨在为游戏玩家提供更高质量的图形体验。
AIxiv专栏发布了一篇关于3D意图定位的研究文章,该技术能够根据用户的意图在3D场景中检测目标物体,而非仅依赖于明确的物体描述。通过引入GPT-4生成意图文本,并采用多模态融合和自适应学习方法,实现了优于现有模型的效果。
MIT 研究人员提出一种使用Transformer解决Empirical Bayes(mean estimation)任务的方法,并发现Transformer在该任务上的性能优于经典方法,且运行速度更快。