学术
网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend
香港科技大学等团队提出SelfDefend框架,让大语言模型首次具备自我保护能力,有效抵御越狱攻击。该框架通过创建并行的影子LLM来检测潜在有害查询,并在不影响正常响应的情况下提升安全性。
不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助
无问芯穹上线满血版DeepSeek-R1、V3模型,支持多平台部署。通过大模型服务平台,无需邀请即可免费使用。同时提供异构算力支持和并发服务包模式。
s1推理模型=数据筛选+推理预算强制,也提醒大家不要进入思维误区
MLNLP社区介绍其愿景是促进国内外自然语言处理及相关领域的交流合作。近日,李飞飞团队的《s1: Simple test-time scaling》引起广泛关注。s1主要通过数据筛选与推理预算强制提升模型性能。核心贡献包括开源训练数据及改进效果验证方法。
比亚迪也在接入DeepSeek!7万级标配高阶智驾,端到端全面铺开
比亚迪在深圳总部发布全民智驾战略,目标2025年6成销量搭载高速NOA及以上的智驾技术。依托自研系统和技术优势,覆盖全系车型并实现性能更强、成本更低的目标。
ICLR 2025 高分论文!何恺明和刘壮提出:数据集偏差的十年之战
MIT副教授何恺明的新研究揭示,尽管过去十多年里业界为构建更大、更多样化数据集做了努力,但现代神经网络似乎越来越善于‘识破’并利用这些数据集中潜藏的偏差。此发现引发对消除数据集偏差是否已取得胜利的质疑。
Deepseek R1 Zero成功复现全过程:三阶段RL,Response长度涨幅超50%,涌现语言混杂
u.com/p/21290410831
编辑丨极市平台
极市导读
Deepseek R1 Zero模