泛化能力归档 - 第3页共6页

近期Claude、Grok系统提示词事件的几点思考及偏好学习中的Scaling law论证

2025年5月18日14时作者老刘说NLP

rompt的事件引发了大家的广泛关注，其中会有些思考，例如System Prompt到底是个啥？作用

2025年5月16日16时作者机器之心

腾讯研究团队采用强化学习结合课程采样策略训练意图识别模型，显著提升其在未知意图上的泛化能力。该方法能有效指导模型关注更具挑战性的数据样本，并通过实验验证了GRPO算法优于传统SFT方法的性能优势。

2025年5月14日16时作者 HyperAI超神经

浙江大学和哈佛大学的研究团队推出了In-Context Edit（ICEdit），一款基于指令的图像编辑框架，仅需极少的文本指令即可实现精准的图像修改。

2025年5月10日16时作者机器之心

深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟

2025年5月9日16时作者量子位

yuanCustom
。
“自定义”主打的就是主体一致性，用一张图片就可以确定视频主角，
其一致性评

2025年5月8日16时作者机器之心

清华大学团队提出傅里叶位置编码（FoPE），通过鲁棒性强的位置编码克服Transformer在处理长文本时的周期性延拓限制，显著提升模型的长文本泛化能力。

2025年5月6日16时作者新智元

新智元报道
具身智能公司Physical Intelligence推出π0.5 VLA模型，通过异构任务协同训练实现广泛泛化能力，机器人能在多种环境中完成复杂任务。

2025年4月28日23时作者新智元

的思维链其实只是复杂的统计模式匹配，而非真正的推理能力。AI模型仅仅通过海量数据和经验法则来生成响应