大语言模型归档 - 第14页共24页 - 每时AI

小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化

2025年3月12日23时作者 AI前线

术变革转向产业变革，大模型应用也会进一步繁荣，传统基础设施技术已经不足以满足大模型应用的快速发展。整

大模型全军覆没，中科院自动化所推出多图数学推理新基准 CVPR 2025

2025年3月11日16时作者量子位

近日，中国科学院自动化研究所推出多图数学推理全新基准MV-MATH，旨在全面评估MLLM（多模态大语言模型）的数学推理能力。结果发现，包括GPT-4o、QvQ等先进模型在该数据集上的表现均不及格。研究团队指出，现有的多模态数学基准大多局限于单一视觉场景，而MV-MATH则包含多个图像和文本交织而成的复杂多视觉场景，覆盖11个数学领域，并分为三个难度级别。

AAAI 2025 北航、港城大提出POI-Enhancer：基于大模型的POI表征学习增强框架

2025年3月11日16时作者 PaperWeekly

tic Enhancement Framework for POI Representation L

全新CoD颠覆推理范式，准确率接近但token消耗成倍降低

2025年3月10日23时作者机器之心

Zoom 研究团队提出 Chain of Draft (CoD) 技术框架，通过优先考虑效率和极简主义，减少推理模型的计算资源消耗，提高响应速度。

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

2025年3月10日12时作者机器之心

基于大语言模型的GUI智能体在执行重复性任务时效率较低。西湖大学提出AppAgentX框架，通过链式存储和动态匹配机制提高其效率与灵活性。

基于Qwen2.5模型的高效文本转语音（TTS）系统 Spark-TTS

2025年3月9日12时作者 GitHubStore

一种基于大语言模型的高效文本转语音系统，采用BiCodec编码简化架构，提升推理效率，并实现零样本语音克隆和精细控制。

AI研究员首次通过双盲同行评审，论文登上顶会ICLR！但已撤稿

2025年3月8日16时作者新智元

历史首个通过双盲同行评审的AI系统Carl撰写的两篇论文被ICLR录用，尽管存在局限性，但展示了其在科研领域的潜力。

目标超级智能，前DeepMind科学家离职创业，获1.3亿刀融资

2025年3月8日16时作者机器之心

Reflection AI 成立，旨在开发超级智能。该公司已获1.3亿美元融资，估值达5.55亿美元。两名前谷歌DeepMind成员担任CEO和联合创始人，团队包括多名顶尖AI研究人员和工程师。公司目标是开发自主编程工具，并将聚焦于自动执行狭窄的编程任务。

谷歌创始人拉里·佩奇出山成立大模型公司，目标智能制造

2025年3月7日16时作者机器之心

谷歌联合创始人拉里·佩奇成立新AI创业公司Dynatomics，旨在用人工智能提升制造业。

播客创作者的福音！港中文、微软、小红书联合推出PodAgent，多智能体协作超给力！

2025年3月7日14时作者小兵的AI视界

香港中文大学联合微软和小红书发布PodAgent技术成果，实现播客全流程自动化生成。其主要功能包括智能语音合成、质量评估与迭代等。该系统通过多智能体协作技术和大语言模型，大幅降低播客创作门槛，并在媒体、教育、企业等领域具有广泛应用前景。