速递|伯克利团队450美元训练新推理模型,堪比OpenAI o1预览版

研究团队NovaSky发布Sky-T1-32B-Preview,这是一种在多个关键基准测试中与OpenAI的o1早期版本具有竞争力的推理模型。训练成本约为450美元,是经济高效复制高级推理能力可能的标志。

GPT-5涌现能力可预测?UC伯克利仅使用当前模型检查点预测未来模型

LLM 规模扩展面临挑战,加州大学伯克利分校团队提出预测涌现能力的任务,并通过拟合参数函数——’涌现定律’来验证和提前准确预测涌现点。研究使用四个标准 NLP 基准进行验证。

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

加州大学伯克利分校的研究表明,不同语言模型在回复语气和风格上存在差异。研究通过VibeCheck方法评估了多个大模型的回复,发现这些模型在友好性、正式性等方面具有不同的特征,并能用于指导开发者选择合适的模型进行应用。

AI模仿人类看漫画,视频大模型时序定位能力新SOTA

NumPro通过为视频帧添加数字标识符的方式提升了视频大模型的时序定位能力。无需训练设置即可增强模型对事件发生时刻的理解,实验结果显示其显著优于现有方法,并且不影响模型通用视频理解能力。