量子位
100行代码打造迷你编程Agent:能修复65%真实项目bug,适配所有大模型
全新开源项目mini-SWE-agent仅用100行Python代码,实现轻量级编程代理,兼容所有主流语言模型。其架构简洁,仅需基础命令即可运行,支持本地终端部署和使用。它能在SWE-bench上解决约65%的问题,相比原版几乎相同水平。
具身智能迎来实力派!十年多模态打底,世界模型开路,商汤「悟能」来了
商汤科技发布”悟能”具身智能平台,推出日日新V6.5多模态推理大模型及”开悟”世界模型。通过大规模仿真、真实数据回流和多视角标注,商汤正构建具身智能的护城河,并计划在工业与家庭领域应用千万量级机器人。
AI教父Hinton对话上海AI Lab周伯文:多模态聊天机器人已经具有意识,让AI聪明和让AI善良是两件事
frey Hinton
因为患有严重的背疾几乎无法长途旅行,只在去年因为领取诺奖才勉强“带伤”飞抵瑞
大模型“天梯赛”来了,让Agent在Kaggle真实任务中进化|佐治亚理工、斯坦福开源
MLE-Dojo是首个为训练和评测大模型智能体设计的交互式环境,它能模拟机器学习工程师的真实工作流程。目前八个顶尖的大语言模型在200多个真实Kaggle竞赛上的测试中,Gemini-2.5-Pro表现最佳,但仍有改进空间。
超大模型推理加速2.18倍!SGLang联合美团技术团队开源投机采样训练框架
SGLang团队联合美团搜推平台和Cloudsway.AI开源SpecForge,这是一个专为投机采样训练而设计的框架。它支持超大模型并显著提升了推理效率,通过集成Eagle3技术实现了2.18倍的加速效果。