量子位，作者每时AI - 第91页共151页

你正在做的大模型评测，可能有一半都是无用功上海AI Lab&上交&浙大出品

2025年3月18日23时作者量子位

一半
都是“重复劳动”！
来自上海AI Lab、上海交大以及浙江大学最新研究显示：当下流行的多模态大

2025年3月18日11时作者量子位

港科大Harry Yang团队联合Everlyn AI提出LightGen模型，仅需8张GPU训练即可实现近SOTA的高质量图像生成效果。该模型采用数据蒸馏和直接偏好优化策略，显著降低了数据规模与计算资源需求。

2025年3月18日11时作者量子位

大模型o3-mini和GPT-o1在数学方面表现出色，陶哲轩和罗博深分别对其进行了测试，并且给予了高度评价。

2025年3月17日16时作者量子位

众擎机器人PM01和SE01凭借灵活度高的特性火出圈，其全身总自由度超过23个，腰部旋转角度超过300°。这两款机器人的跑步、前空翻等动作都酷似人类，并且在外观和功能上各有特色，售价分别为8.8万元和55公斤的SE01机器人。

2025年3月17日16时作者量子位

”
这就是平头哥半导体产品总监
周冠锋
，在中国存储界的盛会MemoryS 2025存储峰会上给出的

2025年3月17日16时作者量子位

前苹果ASIC架构师Nils Graef与UC伯克利本科生Andrew Wasielewski提出Slim Attention，通过只存储K而不直接存储V实现更少的内存占用和更高精度。

2025年3月17日16时作者量子位

零一万物发布万智企业大模型一站式平台，支持企业快速部署和应用DeepSeek模型。该平台提供一体机部署方案、集成API应用及行业定制服务，助力企业从通用大模型转向实际应用场景。

2025年3月17日11时作者量子位

来自中山大学、新加坡南洋理工大学等团队提出跨模态因果对齐框架（CRA），通过抑制噪声、特征对齐和因果关系建模三个模块优化视频问答定位任务，显著提升模型的时空定位能力和因果推理准确性。

2025年3月17日11时作者量子位

小米大模型团队通过微调阿里Qwen2-Audio-7B模型，结合DeepSeek-R1的GRPO算法，在MMAU评测集上实现了64.5%的准确率，显著提升31%，接近人类专家水平。

2025年3月16日23时作者量子位

百度发布两款全新文心大模型，文心大模型4.5主打原生多模态；文心大模型X1是百度版深度思考模型，具备更强的理解、规划、反思和进化能力。两款大模型已同步上线并开放免费API调用，且价格约为DeepSeek R1的一半。