3B模型
微软深夜发布SambaY架构,Phi-4min加速10倍推理
微软微调出高质量合成数据的Phi-4-mini-Flash-Reasoning 3B模型,采用SambaY解码器架构支持64K上下文长度,提供逻辑密集型任务高性能。
3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限,大海捞针准确率超98%
上海交通大学等团队推出Video-XL-Pro模型,实现近一万帧视频的单卡处理,超过Meta发布的7B模型Apollo-7B。采用重构性token压缩技术显著提升了视频理解效率和质量,并在多个长视频评测基准上超越了同参数量的开源模型。