7 月 2025 - 第190页共230页

邱锡鹏老师团队发现SFT与DPO破壁统一：内隐奖励作为桥梁

本文探讨了SFT与DPO的理论关联及其改进方法，提出小学习率策略与基于f散度的新目标可显著提升LLM性能，揭示隐式奖励在两者优化中的作用，并为未来统一框架提供了基础。

2025年7月5日11时作者财联社AI daily

上海交通大学科研团队在AI设计热辐射超材料方面取得突破，研发的逆向设计AI模型能在短时间内生成大量候选设计方案，并从中选出最优方案。该技术有望应用于建筑节能和极端环境温控等领域。

2025年7月5日11时作者 GitHubStore

通过AI驱动的研究报告项目简化研究流程，使用Next.js 15和Together.ai进行网页开发与高级语言模型研究。

2025年7月5日11时作者 GitHubStore

这是一个简单的科研和播客生成项目，使用LangGraph与谷歌Gemini 2.5模型系列结合三个实用功能。用户可以输入科研主题并提供YouTube视频URL，系统会搜索研究主题、分析视频，并生成带有引用的报告及短播客。

2025年7月5日11时作者新智元

逼的Ilya公开叫板。
这场堪称「元宇宙2.0」的超级智能梦，是否又会
和此前大败的元宇宙计划，如出

2025年7月5日11时作者机器之心

上海交通大学联合团队提出MAS-GPT，通过生成式设计范式简化多智能体系统构建，只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法，展示了高效和泛化能力。

2025年7月5日11时作者机器之心

24级博士生。目前在上海交通大学EPIC Lab进行科研实习，接受张林峰助理教授指导，研究方向是高效