重磅! Claude 3.7 Max上线Cursor :史上最强,代码能力再次飞跃

Claude 3.7 Max 是 Cursor 推出的新模型,专为硬核开发者设计。它具有更高的上下文窗口、更多的工具调用限制以及更智能的代码理解和生成能力,价格按用量计费。适合处理复杂代码项目和精细代码维护的开发者。

Transformer 架构重大改进:华人科学家刘壮联合何恺明,Yann LeCun整活

Meta AI华人团队联合大牛发布论文,证明Transformer模型可以不用Normalization层也能达到甚至超越现有性能。核心秘密是Dynamic Tanh (DyT)函数,相比传统方法,DyT简单有效,性能不输且速度快、成本低。

陶哲轩使用o3 mini一手测评来了:好坏参半

陶哲轩使用o3-mini模型研究图论中的三角形移除引理,并对其表现进行了测试。虽然模型能快速给出正确答案,但在更复杂的问题上仍需用户详细指导。陶哲轩认为目前的AI在解决标准问题时有效,但对偏门问题的帮助有限,需要更多用户引导或计算资源支持。