日期: 2025 年 4 月 7 日
Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车
Meta发布AI模型Llama 4后,用户反馈编码能力不佳。尽管在基准测试中表现优异,但在实际编程任务中的效果欠佳,引发讨论。
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准,公司采取混入测试集数据以满足目标的做法引发争议。此外,TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同,并认为这种行为可能误导开发者。
MoCha:开启自动化多轮对话电影生成新时代
本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成,首次提出面向Talking Characters任务的视频生成方法MoCha,实现仅基于语音和文本输入生成完整角色对话视频。
清明假期大模型技术进展回顾:llama4大模型、EasyControl吉卜力风格开源模型及LLM后训练技术总结
今日介绍请清明假期大模型进展,涵盖Llama4开源评测及吉卜力风格图像生成模型EasyControl_Ghibli,指出中文支持效果不佳,建议谨慎使用。同时总结了多模态微调与继续预训练讨论,并推荐相关技术文章阅读。
关税刷屏的一周,AI圈也暗流涌动:Llama 4来了,O3和O4-mini也要来了,DeepSeek R2和GPT-5也不远了?
Meta发布Llama 4系列,强调多模态和超长上下文窗口;OpenAI确认O3和O4-mini即将上线且GPT-5将免费;DeepSeek与清华提出SPCT方法提升推理扩展性能。