技术报告
Meta 你摊上事了!Llama 4 vs DeepSeek:谁才是最强开源模型?
Meta 新发布的Llama 4因基准测试成绩亮眼但遭用户质疑,称其实际表现不佳。Meta 因疑似数据污染技术而受到批评。此外,Meta的Llama 4 Maverick模型在多个任务如前端开发、逻辑推理等方面的表现也不尽人意。
11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
小明 发自 凹非寺。AI视频研究取得新突破,Open-Sora 2.0正式开源,支持高压缩比视频自编码器,可大幅降低推理成本并加速训练过程。
Open-Sora 2.0全面开源,20万复刻百万级大片!11B媲美闭源巨头,224张GPU创奇迹
款全新开源的SOTA视频生成模型,仅20万美元(224张GPU)成功训练商业级11B参数视频生成大模
5分钟顶人类8小时!OpenAI Deep Research订阅全推送,端到端强化微调是关键
OpenAI推出Deep Research功能,可快速完成复杂研究任务。该功能允许更多订阅用户每月查询10次,并嵌入带引用的图片和上传文件。OpenAI强调其安全性测试及隐私保护措施。
突发!DeepSeek被美国质疑「偷窃」,遭OpenAI微软调查,论文曝突破英伟达护城河
春节期间,关于AI公司DeepSeek的风波在圈内引发关注,微软安全研究人员发现一些相关个人通过OpenAI API大规模提取数据,可能违反了服务条款。彭博社报道指出,DeepSeek团队表示未使用OpenAI模型输出数据,并披露多阶段训练细节,强调保护自身知识产权的重要性。
DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
作者
|
王兆洋
邮箱
|
wangzhaoyang@pingwest.com
像是迷雾中走出的一头
支持20+视觉任务,多项SOTA!可扩展多任务视觉基础模型LaVin-DiT:融合时空VAE与DiT
↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
模型
DeepSeek版o1炸场,数学代码超越OpenAI,每天免费玩50次,后续将开源
DeepSeek版o1来了,发布即上线。模型名为DeepSeek-R1-Lite,预览版在数学和代码任务上超越O1-preview,大幅领先GPT-4等。模型使用强化学习训练,推理越长表现更强。网友实测结果显示其数学能力较强,编码任务稍显不足。