ArXiv
更多thinking≠更好结果,精准thinking可砍掉一半长度
MLNLP社区是国内外知名的机器学习与自然语言处理社区。该文章讨论了大模型推理的冗长问题,并提出了一种名为LC-R1的方法来优化模型长度压缩,显著减少无效思考,提高效率。
Labubu换装记!让视频换装变得如此简单!基于扩散Transformer的视频虚拟试衣新突破
MagicTryOn项目利用Transformer模型实现高质量视频试衣效果,包括图像和视频试衣支持。该技术已在多个场景中展现出巨大潜力。
研究:LLM的prefilling功能,反而成为了它的越狱漏洞!
一项最新研究揭示大语言模型中的预填充功能成为绕过安全限制的最有效攻击工具,成功率高达99.82%。研究表明,预填充技术不仅用于提高输出质量,反而可能破坏AI的安全边界。
2025-04-26 | AI每日速报
今日AI焦点:Anthropic启动模型’福祉’研究引思考,Adobe升级Firefly创意工具,xAI拟融资200亿美元;微软、OpenAI进展动态,Google发布Recall功能和ZAPBench数据集。
7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量
学术研究团队提出了一种名为 ScholarCopilot 的智能大模型框架,专门用于精准生成带有准确引用的学术文本。ScholarCopilot 采用动态机制,在生成过程中实时检索并插入文献引用,提高了引用准确性与相关性。
让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区 ICRA 2025
近期,香港科技大学研究团队提出了一种新算法Falcon,通过将轨迹预测算法融入社交导航任务中,实现了长期动态避障并提升导航性能。该算法已在ICRA 2025接收,并构建了两个新的数据集Social-HM3D和Social-MP3D作为社交导航的新基准。
arXiv科研神器:Mistral OCR、Claude 3.7合体实现论文速读
2025年arXiv论文将自动生成博客风格概述。alphaXiv结合Mistral OCR和Claude 3.7生成清晰易懂的文章,大幅提高科研效率。
港理工提出TokenSkip:让大模型在CoT中“跳”过冗余token,压缩40%,性能几乎不降!
MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。近日,一篇关于LLM的论文提出TokenSkip方法,通过跳过不重要token来压缩思维链,提高推理速度和用户体验。