每时AI
活高效地选择关键 token 进行注意力计算,大幅度降低了 LLMs 在处理长文本时的计算负担,且在
内存占用<3B,特别支持网页搜索。 编辑 | Panken 智东西12月16日报道,今日,清华系AI