田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索

田渊栋团队利用连续隐向量进行推理,提出两层Transformer可以解决ProsQA问题,准确率达到99%,远超12层离散CoT模型的83%。论文发表于arXiv,该成果不仅应用于科学研究,还激发了作者创作科幻小说的兴趣。

DeepSeek综合征?Yann LeCun:硅谷存在一种“错位的优越感”

著名人工智能科学家Yann LeCun批评硅谷某些圈子存在的错位优越感,并将其分为三个阶段的症状:早期、中期和晚期。他认为科学和技术的进步需要更多人参与并积极分享创新成果,强调了开放共享的重要性。