学术归档 - 第169页共283页

强化学习成帮凶，对抗攻击LLM有了新方法

2025年3月6日23时作者机器之心

威斯康星大学麦迪逊分校团队提出了一种使用强化学习对机器学习模型实施黑盒逃避攻击的方法，该方法能够有效生成对抗样本，且无需昂贵的梯度优化。研究发现，在CIFAR-10图像分类任务上，强化学习智能体在训练过程中提高了对抗样本的有效性和效率。

2025年3月6日23时作者机器之心

Lens of Self-Evolution
论文链接：https://www.researchg

2025年3月6日23时作者机器之心

语言建模与推理能力，引爆了全球 AI 社区。与此同时，一个隐藏在超大规模模型身后的技术命题浮出水面：

2025年3月6日23时作者机器之心

工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouS

2025年3月6日19时作者 GiantPandaCV

.co/meituan/DeepSeek-R1-Block-INT8/tree/main/infer

2025年3月6日16时作者机器之心

阿里开源发布新推理模型QwQ-32B，参数量为320亿。其性能可媲美6710亿参数的DeepSeek-R1满血版。千问团队通过大规模强化学习提升了模型的推理能力，在数学和编程任务上表现优异，并提供了API使用指南。

2025年3月6日16时作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

2025年3月6日16时作者 PaperWeekly

，确保其安全性和对齐性已成为重中之重。
然而，LLMs 仍面临越狱攻击的严峻挑战，现有的越狱攻击方法

2025年3月6日16时作者机器之心

本文介绍了一种新的扩散策略ET-SEED，它结合了轨迹级SE(3)等变性扩散和高效的去噪策略，在少量示范数据下能够高效学习复杂的机器人操作技能，并且在不同物体姿态和场景下的泛化能力也得到了提升。

2025年3月6日16时作者 PaperWeekly

里的精妙布局，再到医疗档案中的多维数据展示，这些富含视觉元素的文档，不仅仅是简单的文字堆砌，而是融合