北大发布OpenS2V-Nexus:500万视频数据集+全新评测框架双开源,主体一致性视频生成领域新基建
一个包含500万视频数据的OpenS2V-5M数据集和一个全新的OpenS2V-Eval评测框架。该
一个包含500万视频数据的OpenS2V-5M数据集和一个全新的OpenS2V-Eval评测框架。该
清华大学等机构的研究人员开源了YOLOv13,这是一个基于超图增强的实时目标检测算法。通过引入超图理论来捕捉特征间的高阶关联,并结合轻量化设计,在保持高效率的同时显著提升了检测精度。
谷歌 Gemini CLI 是一款开源终端 AI 智能体,支持自然语言命令执行强大的 AI 功能,包括编程、聊天和内容创作等。免费版本提供100万 token上下文窗口,每分钟60次请求限制,成为新的竞争对手。
Meta挖走了三位OpenAI研究人员,包括Xiaohua Zhai、Lucas Beyer和Alexander Kolesnikov。这三人一直以来都是密切的合作伙伴,共同参与了重要的研究工作。
中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队合作研究Diffusion Transformers的超参优化,提出μP理论并将其应用于实际模型训练。通过大规模实验验证了该方法的有效性,并开放论文代码供进一步研究。