极市干货
图像生成迎来CoT时刻!港中文首次提出文生图的o1推理和inference scaling新范式!
香港中文大学、北京大学和上海AI Lab的研究者提出了一种结合思维链推理的新方法来提升自回归图像生成的质量和文本一致性,显著提高了图像生成的性能。
TNNLS’25|东北大学贾同教授团队提出SOTA模型AO-DETR,解决X-ray图像违禁品检测领域难题!
↑ 点击
蓝字
关注极市平台
作者丨粉丝投稿
编辑丨极市平台
极市导读
东北大学贾同团队提出了一种名
ICLR 2025|4K分辨率拿下!超强杀器SANA:线性扩散模型+文生图+高分辨率+从头训练的极佳范本!
↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
Sana通过32倍压缩率的A
中国AI太强,Meta工程师吓疯?自曝疯狂熬夜复制DeepSeek,天价高管心虚了
Meta员工在TeamBlind上爆料,DeepSeek公司训练成本仅550万美元就推出了性能堪比OpenAI的AI模型。这令Meta高管们感到尴尬和紧张,Meta工程师也正在争分夺秒地分析DeepSeek的技术细节。
ICLR 2025 Ross: 多模态大模型的 MAE 时刻?
本文介绍了一篇关于Reconstructive Visual Instruction Tuning (Ross)的工作,该方法通过引入视觉监督来提升多模态大模型的细粒度理解能力,并显著减少幻觉现象。该方法已成功应用于多个基准测试中,与现有技术相比表现出色。