极市干货
DeepSeek、OpenAI视觉推理到底哪家强?MME-CoT:全新推理Benchmark, 全方位理解LMM的CoT能力
MMLab提出一个新基准测试框架MME-CoT,用于全面评估大型多模态模型在视觉推理任务中的链式思考
大模型轻量化系列解读 (八):降低 LLM 中因 Activation Spikes 导致的量化误差
型语言模型在后训练量化时面临的激活量化挑战,发现GLU激活中的“激活尖峰”会导致显著的量化误差。为此
ICLR 2025|高达 128 倍下采样的 Autoencoder!DC-AE:高效加速高分辨率扩散模型
utoencoder,以加速高分辨率扩散模型
。
>>
加入极市CV技术交流群,走在计算机视觉的最前
马斯克大力出奇迹,Grok3 把 o3 干翻了
马斯克发布了最新的大模型Grok-3和推理版,其在多种评测中得分最高,包括1402分在所有类别中的排名首位。Grok-3具备Reasoning、DeepSearch等功能,且支持Big Brain选项,展示了强大的创意编程能力和搜索理解能力。