学术
Cursor重磅上线Claude Max,工具调用一次0.05美元,充值实测一波
AI 编程神器 Claude Max 新发布,核心优势在于处理大规模代码和复杂逻辑。它能辅助开发者进行应用开发,并优化个人财务规划。Claude Max 支持高达 200K 的上下文窗口及 200 次工具调用,但需额外付费使用,模型表现卓越却价格不菲。
牛津提出新方法让LLM reasoning能力翻倍!从“单打独斗”进化成“团队作战”
MLNLP社区介绍其知名社区致力于推动国内外自然语言处理与机器学习领域内的交流合作,本文分享了一篇论文,通过集成搜索助手、代码助手和思维导图管家等工具帮助大型语言模型提升推理能力的文章,并展示了其实验结果及其潜力。
股价止跌失败,黄仁勋透露Blackwell Ultra和Vera Rubin上市时间,推理能力成重点
黄仁勋在GTC2025大会上发布了英伟达芯片的最新消息:Blackwell Ultra、NVIDIA GB300 NVL72和Rubin架构。其中,Blackwell Ultra实现了AI计算性能大幅提升,而Rubin架构则采用定制化Arm核心设计,提升了计算性能和数据处理效率。
无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
LightGen 是由香港科技大学 Harry Yang 教授团队联合 Everlyn AI 和 UCF 提出的一种新型高效图像生成模型,旨在解决主流生成模型依赖大量数据和计算资源的问题。论文提出通过知识蒸馏和直接偏好优化策略,在有限的数据和计算资源下实现了高质量图像的生成,并在多个实验中展示了与 SOTA 模型相当甚至超过的性能表现。
蛋白质突变工程 AI 模型评测新基准,上海交大洪亮教授团队发布 VenusMutHub
上海交通大学洪亮教授团队发布VenusMutHub——首个针对真实应用场景的蛋白质突变小样本数据集及评测标准。该研究发表在Acta Pharmaceutica Sinica B期刊上,揭示了现有AI模型在实际应用中的局限性,并提出改进方案。