一手实测让马斯克睡帐篷的Grok4,DeepSeekR2又多一位可笑的对手
马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。
马斯克的Grok4发布会因推迟和低效表现引发关注。尽管新套餐价格高昂,但其在数学、物理等领域表现亮眼,但在代码编写和多模态任务上存在局限性。作者分享了使用基础版Grok4的经验,并提出了一些改进意见。
谷歌发布Gemini 2.5系列大模型技术报告,详细介绍了AI玩《宝可梦》的具体行为。其中特别提到Gemini 2.5 Pro在游戏过程中表现出惊人的创造力和长期规划能力,如飞行技能逃脱困境、为复仇训练特定宝可梦等。同时指出AI存在幻觉问题及思维定势现象。
Google 在 I/O 2025 大会发布了多项重要更新,包括 Gemini 2.5 全系更新、Gemma 3 系列的内存优化和 Imagen 4 的图像细节提升等。同时,Veo 3 支持视频与音频同时生成,Imagen 4 提升了写实和抽象风格图片处理能力,并集成至多个 Google 软件产品中。
谷歌Gemini 2.5 Pro视频理解能力提升,可在6小时内处理长达6小时视频,并实现视频到应用的转化、精准片段检索及强大的时序推理等新功能。
OpenAI.fm、Python A2A、LLManager、Together Open Deep Research、Gemini Coding Agent 和 Gemini 2.5 Flash 等创新项目介绍。