DeepSeek Prover-V2,这才是探索AGI 的正确姿势!
DeepSeek 推出新模型 DeepSeek-Prover-V2-671B,专为数学定理证明打造。该模型参数量大(671亿),架构使用MoE技术,隐藏维度高达7168,支持超长上下文窗口(约80万汉字)。通过Lean 4生态训练,并结合生成自然语言讲解与强化学习提升性能。
DeepSeek 推出新模型 DeepSeek-Prover-V2-671B,专为数学定理证明打造。该模型参数量大(671亿),架构使用MoE技术,隐藏维度高达7168,支持超长上下文窗口(约80万汉字)。通过Lean 4生态训练,并结合生成自然语言讲解与强化学习提升性能。
Meta因DeepSeek开源模型陷入被动,后者在性能、商业自由、训练成本等方面均超越Llama系列。然而Meta内部表现不佳,开发社区出现分裂,开发者们既有人转向DeepSeek,也有人坚守Llama等待反击。英伟达股价受此影响大跌,但支持者认为这将进一步扩大AI的舞台和能力边界。
微软发布的新材料生成模型MatterGen能够直接根据需求生成新材料,避免了传统试错实验。它使用扩散模型从随机结构开始调整原子位置、元素种类和周期晶格来生成新材料。该模型还可以根据多种属性条件进行条件生成,目前已开源用于研究和实际应用。