AI复现顶尖AI论文?OpenAI最新测评:Claude 3.5得分第一

PaperBench测试了多款AI模型复现ICML 2024顶会论文的能力。结果显示,Claude 3.5 Sonnet表现最好,平均得分为21.0%。研究发现当前AI在长期规划、持续调试和策略执行方面存在问题。PaperBench为评估AI科研能力提供了量化标准,有助于加速科学发现并推动开放协作。

AI视频生成一夜被颠覆:Runway重磅发布Gen-4,保真度、动态性、一致性全面升级

Runway公司发布了新一代视频生成模型Gen-4,解决了场景一致性问题并增强了保真度、动态运动捕捉和可控性。Gen-4的核心优势包括高动态与真实感、高度一致性及精准理解与执行能力。

阿里Qwen版高级语音模式和实时视频聊天模式来了:每天10次试用

阿里发布Qwen2.5-Omni-7B模型,支持实时语音和视频聊天,并开源其技术报告。该模型采用’思考者-说话者’架构实现跨模态处理能力,性能达到同类最佳水平,在多个垂直领域表现出色。