一文看懂多模态思维链

多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605

阿里发现新方法:仅用小纸条和错题本,就能使数学近满分、code能力翻番…

MLNLP社区是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。近期发布了有关LLM如何通过自我学习和工具调用提升推理能力的论文。START模型能自动调用Python等外部工具解决复杂问题,未来AI或将随身携带各种工具箱。

一个框解决所有需求?如何用夸克AI超级框实现100个APP的生产力

夸克发布了AI超级框功能,可以直接调用阿里完善的工具基建完成任务。它在健康、影视、学术领域提供了专业的内容搜索,并支持 AI 编程和 PPT 设计等功能。同时拥有强大的模型生态,涵盖多模态信息处理与深度推理能力。

普通人如何抓住AI浪潮?马斯克Grok3发布,梁文锋DeepSeek重磅论文

马斯克在社交平台X上宣布Grok 3——地球上最聪明的人工智能模型发布,声称其推理能力超越ChatGPT和DeepSeek。DeepSeek面临挑战,需加快技术追赶步伐。文章还介绍了DeepSeek的突破性成果原生稀疏注意力,并指出AI竞争远未结束。

马斯克发布地表最聪明 AI!号称超越 DeepSeek R1,20 万张卡砸出的「奇迹」

马斯克发布Grok 3,这款新版本采用最佳预训练模型并继续使用强化学习进行训练。它在LMSYS盲测中排名首位,并且在超级订阅计划下提供额外的推理和DeepSearch查询功能。Grok 3还包含了一个被称为下一代搜索引擎的DeepSearch产品。

被AI追杀,还要解谜逃生!UCSD等发布LLM测试神器,边玩游戏边评估

新智元报道
编辑:犀牛 好困
GameArena团队开发的《AI Space Escape》游戏通过紧张刺激的密室逃脱方式评估AI模型的推理能力,生成宝贵的游戏数据,并将所有数据公开供进一步研究。该游戏超越了传统的数学和编程基准测试方法。