接棒DeepSeek!阿里千问宣布开源百万Token上下文模型:主打闪电般的推理「附送详细技术报告」 上午8时 2025/01/27 作者 AI寒武纪 阿里通义千问团队推出Qwen2.5-1M开源模型,支持百万Token上下文长度,并带来闪电般快速的推理框架。
同济提出简化 Transformer结构:在RTX3090上实现CLIP的轻量级训练 ! 下午11时 2025/01/14 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨小书童 来源丨集智书童 编辑丨极市平台 极市导读 同济大学提出的