一个模型超了DeepSeekR1、V3,参数671B,成本不到350万美元

MLNLP 社区致力于促进自然语言处理的研究与发展。Deep Cogito 提供了开源模型,通过迭代蒸馏与增强技术改进模型性能。Cogito v2 模型展示了强大的推理能力,并已在多个基准测试中优于多数开源模型。

第十届语言与智能高峰论坛日程公布

MLNLP社区是国内外知名的人工智能与自然语言处理社区,致力于促进学术界、产业界和爱好者的交流合作。第十届语言与智能高峰论坛将于2025年8月在乌鲁木齐举行,参会者可享受注册费优惠。

AI 安全新挑战!“弱到强越狱攻击” 如何轻松破解大型语言模型防线?

MLNLP社区发布了一篇关于大型语言模型安全性的论文《Weak-to-Strong Jailbreaking on Large Language Models》,提出了弱到强越狱攻击方法,该方法能在一次前向传递中大幅提高对齐LLMs生成有害文本的成功率,并揭示现有防护措施的不足。

辛顿上海演讲全文

MLNLP社区致力于推动国内外机器学习与自然语言处理领域的交流合作。作为知名社区,其愿景是促进学术界、产业界和爱好者之间的进步。近日WAIC大会上,Geoffrey Hinton发表了开幕演讲,讨论了数字智能与生物智能的关系,并分享了他早期模型如何结合两种理论的观点。该文章还提到了大模型的发展以及它们在语言理解方面的应用,强调了人类理解和AI系统之间的一些相似之处。最后讨论了全球合作对于解决AI安全问题的重要性。