细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈
香港中文大学MMLab团队发布视觉推理方案MINT-CoT,专为解决数学视觉推理难题设计。该方法通过引入Interleave Token实现细粒度、轻量级的视觉交错CoT推理,显著提升多模态大模型在数学视觉推理任务中的表现。
香港中文大学MMLab团队发布视觉推理方案MINT-CoT,专为解决数学视觉推理难题设计。该方法通过引入Interleave Token实现细粒度、轻量级的视觉交错CoT推理,显著提升多模态大模型在数学视觉推理任务中的表现。
多伦多大学和哈佛医学院等机构开发的AI系统otto-SR可以在两天内完成传统方法需12年的工作,显著提高了医学研究领域中Cochrane系统评价的效率。otto-SR结合GPT-4.1和o3-mini进行筛选和数据提取,相比人类评审员表现出更高的准确性和灵敏度。
Midjourney发布视频生成模型V7,并引发热议。视频效果逼真,包括跑步、挖蛋糕等场景。物理真实感和细节表现优秀,但音频问题引发讨论。团队表示正在完善并呼吁用户参与评分和提出定价建议。同时,图像生成模型V7也在不断更新中。
6月26日,由智猩猩、智东西共同主办的2025中国AI算力大会将在北京中关村东升科技园万丽酒店举行。会议包括主会场、分会场和展览区,并设有高峰论坛、AI推理算力专题论坛和智算中心专题论坛等内容。
学术网站正遭受AI爬虫的「数字蝗灾」,影响科研开放获取。学术网本是知识宝库,却因异常访问而瘫痪。坏爬虫疯狂抓取数据供生成式AI训练,导致服务器超载、资源中断。学术界呼吁制定公平使用协议,以保护开放获取知识库。
研究员Keller Jordan仅凭一篇关于神经网络隐藏层优化器Muon的博客文章加入OpenAI,并可能用其训练GPT-5。Muon在CIFAR-10和NanoGPT等任务中表现出色,且内存需求低、运行效率高。
r Science;曹峻泰是英属哥伦比亚大学研究生,主要研究兴趣集中在大模型推理和可解释性研究;本文