大模型
大语言模型
Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪:兼看大模型逻辑推理技术总结及几点思考
近日推理大模型相关前沿回顾包括Claude 3.7的发布,Qwen的QwQ模型开源,FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术,并提出了一些值得思考的问题。
没有预热,只有实力:Claude 3.7 Sonnet不声不响,惊艳全场!
Anthropic发布新模型Claude 3.7 Sonnet,这是一个混合推理模型,提供即时回答和深入思考两种模式。Claude 3.7 Sonnet在编程测试中表现出色,并且推出了辅助编程工具Claude Code。
顶刊TPAMI 2025!北大、KAUST等提出可逆扩散模型赋能图像重建,代码已开源
本文提出了一种可逆扩散模型IDM,通过端到端训练框架和双层可逆网络设计显著提升图像重建性能与效率。在图像压缩感知重建任务中,相比其他方法,该模型在PSNR指标上提升了2dB,并将采样步数从100步减少至3步,推理速度提高了约15倍。