天工不止造物,也能修bug:Skywork-SWE给代码智能体补上软件工程课 2025年6月20日11时 作者 机器之心 的书。它让人相信:技术不是死物,而是人与世界持续互动的方式。 如果说「天工」代表了中国古代对「工程」
Image Caption复兴宣言!南大港大CapArena重塑「详细图像描述」评测体系 2025年6月12日16时 作者 PaperWeekly 发展,现代的视觉语言模型可以生成详细而全面的描述。然而,由于评测的主观性和困难,当前的视觉语言评测往
函数向量对齐技术,让大模型持续学习不“失忆”丨ICLR 2025 2025年5月30日16时 作者 量子位 怪。 最近来自中国科学技术大学、香港城市大学和浙江大学的联合研究团队,通过对多个语言模型、任务序列和
基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传 2025年5月29日16时 作者 量子位 过明确的 “长度指令” ? 比如,“写一篇10,000字的长文,详细分析某个议题。”看似简单的要求,
开源即屠榜!UniME多模态框架登顶MMEB全球训练榜,刷新多项SOTA纪录 2025年5月8日11时 作者 量子位 SOTA来了! 格灵深瞳、阿里ModelScope团队,以及通义实验室机器智能团队联合发布通用多模态
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能 2025年5月1日16时 作者 量子位 理证明,大幅刷新多项高难基准测试。 在普特南测试上, 新模型 DeepSeek-Prover-V2
DeepSeek联合清华公布推理时Scaling新论文!R2要来了? 2025年4月5日14时 作者 Datawhale pSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社
AAAI 2025 西交、港城大等提出LLMEmb,基于LLM的序列推荐嵌入生成器 2025年3月1日16时 作者 PaperWeekly 的论文,该论文已被 AAAI 2025 接收。这篇文章提出了一种新颖的 基于 LLM 的序列推荐推荐
如果GPT-4还只是阿米巴原虫,未来的霸王龙会是什么样? 赫拉利《智人之上》 2025年2月28日16时 作者 量子位 的信息革命之中。 但这到底是一场怎样的革命?最近这几年,太多突破性的发明如洪水般滚滚而来,以至于我们