OpenAI发布AI研究新基准PaperBench,已能复制21%顶会论文!斯坦福研究发现LLM已比人类专家更具科研新颖性

OpenAI发布的PaperBench测评基准测试了AI复现顶级学术论文的能力,Claude 3.5 Sonnet在20篇ICML论文测试中的平均得分为21%,超过了一半的顶会论文。该基准不仅严苛要求,还开源代码鼓励研究者参与。此外,斯坦福大学的研究表明LLM能提出有创意的新想法,但其可行性有待提升。OpenAI研究员Jason Wei认为AI科学创新将有两种风格:专注特定问题或训练通用型AI系统。未来AI在科研领域的潜力巨大,包括辅助和引领重大突破。

张小珺+广密大模型季报的20条总结:「智能才是主线」

张小珺和广密分享了20个AGI核心观点,包括pre-training是决定模型上限的关键,Coding被视作实现AGI的最佳环境,以及Agent落地需要的三大能力。他们预测未来AI竞争将如攀珠峰,价值会从硬件分配向模型和应用利润转移。

刚刚,这家用AI 制药的公司,完成了6亿美元融资!

Isomorphic Labs 宣布完成6亿美元融资,致力于用AI重新定义药物研发流程。该笔融资由Thrive Capital领投,与Eli Lilly和Novartis建立战略合作关系,价值近30亿美元。公司利用AlphaFold3模型预测生物分子结构,加速药物发现进程。