递归神经网络的复兴:Mixture-of-Recursions 2025年7月18日14时 作者 PaperAgent 近期Google DeepMind的研究人员设计了一种能够根据词的重要性调整计算量的语言模型,通过一个轻量级的‘路由器’决定每个词在共享网络模块中的循环次数,显著提高了模型性能和效率。
AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案 2024年12月2日14时 作者 新智元 新智元报道 编辑:Aeneas 好困 【新智元导读】 LLM在推理时,竟是通过一种「程序性知识」,而