学术归档 - 第41页共283页

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

2025年6月24日23时作者机器之心

「长思维链」等技术的兴起，带来了需要模型生成数万个 token 的全新工作负载。
大多数语言模型都基

2025年6月24日23时作者 PaperWeekly

近日，中山大学计算机学院与腾讯微信搜索团队联合提出 Q-RM（Q-function Reward Model），在 ICML 2025 正式发表。这一方法专注于构建更精确的 token-level 奖励信号，显著提升了大语言模型的训练效率和效果。

2025年6月24日23时作者 PaperWeekly

下，
MiMo-VL
与
Seed-VL
两大系统在后训练链条上的策略博弈，展现了当前业界对指令对齐

2025年6月24日23时作者极市干货

中科院自动化所与字节跳动联合提出BridgeVLA，通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计，大幅提高了数据效率和任务成功率。

2025年6月24日23时作者机器之心

而这些，正是讯飞用了20多年打下的底子。
设好闹钟，手指悬空待命，购物节一开场
——
啪！
2
秒下

2025年6月24日16时作者机器之心

Der8auer 使用 Shunt Mod 将一块华硕 ROG Astral LC RTX 5090 改装到可承受高达 800W 功率，使其性能超越了售价 10,000 美元的 RTX Pro 6000。然而，这种改装可能对 GPU 的寿命造成风险。

2025年6月24日11时作者机器之心

中科院自动化所谭铁牛团队提出BridgeVLA，通过将预训练和微调的输入输出对齐到统一2D空间来提升3D VLA模型的数据效率与操作效果。

2025年6月23日23时作者 PaperWeekly

论文提出CMCRL框架解决放射学报告生成任务中的挑战，包括长序列文本生成、病灶定位和视觉-语言偏倚问题。通过两阶段设计有效捕捉并校正跨模态数据中的偏倚，显著提高准确率和临床可信度。

2025年6月23日23时作者极市干货

介绍了 Mirage Persistent Kernel，它能自动把小语言模型（LLM）推理转化为一

2025年6月23日23时作者 PaperWeekly

指标，
对于
提升
LLM 可信度
、支撑
下游任务至关重要。
然而，传统基于概率的不确定性估计方法