百度开源文心4.5系列10款模型,多项评测结果超DeepSeek-V3

百度正式开源文心大模型4.5系列,涵盖多种参数规模的混合专家(MoE)和稠密参数模型。该系列预训练权重和推理代码已完全开源,并在多平台可下载部署使用。文心4.5在多个文本和多模态基准测试中达到SOTA水平,支持学术研究和产业应用。

微软推出深度视频探索智能体,登顶多个长视频理解基准

论文提出 Deep Video Discovery (DVD),通过将长视频分割成多粒度片段并利用LLM推理能力自主规划工具获取信息来回答问题。在最新的推理模型OpenAI o3帮助下,DVI以74.2%准确率超越现有工作,在LVBench上大幅领先。