Transformer 架构重大改进:华人科学家刘壮联合何恺明,Yann LeCun整活

Meta AI华人团队联合大牛发布论文,证明Transformer模型可以不用Normalization层也能达到甚至超越现有性能。核心秘密是Dynamic Tanh (DyT)函数,相比传统方法,DyT简单有效,性能不输且速度快、成本低。

陶哲轩使用o3 mini一手测评来了:好坏参半

陶哲轩使用o3-mini模型研究图论中的三角形移除引理,并对其表现进行了测试。虽然模型能快速给出正确答案,但在更复杂的问题上仍需用户详细指导。陶哲轩认为目前的AI在解决标准问题时有效,但对偏门问题的帮助有限,需要更多用户引导或计算资源支持。

劲爆!刚刚首个通用AI Agent Manus 遭“破解”?创始人 Peak 亲自下场回应质疑

AI圈爆火的Manus被质疑后创始人回应称sandbox开放是设计的一部分,并非核心机密,真正亮点在于其多Agent架构。Peak强调沙箱一定程度的开放性并非秘密,且模型使用开源技术。

稚晖君再放大招!智元机器人发布首个通用具身基座模型:实现不同形态机器人丝滑迁移,具身智能门槛狂降

前华为天才少年稚晖君的公司智元发布了首个通用具身基座模型启元大模型Genie Operator-1(GO-1),其背后采用了全新的Vision-Language-Latent-Action (ViLLA)架构。