学术
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的一个小技巧
R1 应用一个fuse shared experts到普通256个expert中的工作 (https
无需预对齐即可消除批次效应,东京大学团队开发深度学习框架STAIG,揭示肿瘤微环境中的详细基因信息
团队提出了一种名为 STAIG (基于图像辅助的图对比学习进行空间转录组学分析)的深度学习框架,能够
近千个反现实视频构建了「不可能」基准,哪个AI不服?来战!
新加坡国立大学的研究团队提出了Impossible Videos概念,构建了包含多种不可能场景的基准IPV-BENCH,用于评测AI视频生成和理解能力。研究发现当前模型在生成和识别不可能事件方面存在挑战,并指出了未来改进的方向。
ICLR25|史上最全面的多模态知识编辑基准!北京通用人工智能研究院BIGAI联合中科大提出MMKE – Bench!
出MMKE – Bench,这是史上最全面的多模态知识编辑基准,涵盖跨越33个广泛的类别视觉实体编辑