机器之心
年末重磅!ByteDance Research视频理解大模型「眼镜猴」正式发布
ByteDance Research 的视频理解大模型眼镜猴(Tarsier)迎来了重大更新,发布了第二代模型 Tarsier2 及相关技术报告。Tarsier2 能够分析复杂的影视名场面,并对真人和动画、横屏和竖屏、多场景和多镜头的视频进行描述,其性能超越了 GPT-4o 和 Gemini-1.5-Pro 等闭源模型,在多个公开基准上表现出色。
AI革新科研模式,上海AI Lab「AI4S攀登者行动计划」开放申请
AI4S攀登者行动计划旨在解决传统研究模式的限制,推动具有重大变革潜力的下一代技术。该计划聚焦发展跨学科颠覆式创新,并通过多维度的支持体系助力科研团队加速项目实施和价值转化。
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行
近日,贾佳亚团队联手 Adobe 团队提出 GenProp 模型。GenProp 能完成几乎所有 ‘传播’ 任务,并能追踪实例(如影子、反射),弥补感知模型缺陷。它还能移除物体的 side effects,插入独立运动物体,进行物体替换和背景替换,以及编辑特效。
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
Meta员工在匿名社区发帖称,国内AI创业公司DeepSeek发布的DeepSeek-V3和DeepSeek-R1模型成本低廉、性能强劲,引发恐慌。该帖子提到DeepSeek-V3在多项评测成绩超越其他开源模型,并指出其训练成本仅为558万美元。
2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具
ByteDance Research 推出的学术论文检索工具PaSa,在复杂的学术搜索场景中展示了显著优势,相比主流检索工具和强化学习模型均有提升。