学术归档 - 第197页共283页

上海AI Lab、天津大学发布MIS数据集，揭示多模态大模型安全微调瓶颈

2025年2月11日23时作者 PaperWeekly

AGI 的重要问题。一些工作
[1, 2]
发现通过引入安全相关的外部监督信号对大模型进行微调可以让

2025年2月11日16时作者机器之心

香港科技大学等团队提出SelfDefend框架，让大语言模型首次具备自我保护能力，有效抵御越狱攻击。该框架通过创建并行的影子LLM来检测潜在有害查询，并在不影响正常响应的情况下提升安全性。

2025年2月11日16时作者机器之心

无问芯穹上线满血版DeepSeek-R1、V3模型，支持多平台部署。通过大模型服务平台，无需邀请即可免费使用。同时提供异构算力支持和并发服务包模式。

2025年2月11日16时作者机器之心

硅谷的防线之后，在预设中总是落后半拍的中国 AI 军团，这次竟完成了一次反向技术输出，引发了全球范围

MLNLP社区介绍其愿景是促进国内外自然语言处理及相关领域的交流合作。近日，李飞飞团队的《s1: Simple test-time scaling》引起广泛关注。s1主要通过数据筛选与推理预算强制提升模型性能。核心贡献包括开源训练数据及改进效果验证方法。

2025年2月11日12时作者机器之心

姚期智提出了一个与哈希表有关的猜想。现在，40 年过去了，一名本科生却成功推翻了这个猜想。而这项成就

2025年2月11日12时作者机器之心

比亚迪在深圳总部发布全民智驾战略，目标2025年6成销量搭载高速NOA及以上的智驾技术。依托自研系统和技术优势，覆盖全系车型并实现性能更强、成本更低的目标。

2025年2月10日23时作者极市干货

感知计算和可学习幂函数，PolaFormer在保持线性复杂度的同时，显著提升了模型的性能和效率，并在

2025年2月10日23时作者极市干货

MIT副教授何恺明的新研究揭示，尽管过去十多年里业界为构建更大、更多样化数据集做了努力，但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。

2025年2月10日23时作者极市干货

u.com/p/21290410831
编辑丨极市平台
极市导读
Deepseek R1 Zero模