Gemini 2.5 Pro强势更新并霸榜,Claude 3.7首次遭遇全方位碾压!
Google DeepMind发布的Gemini 2.5 Pro在LMArena多个AI竞技场全面领先,实现文本、视觉和Web开发领域的统治地位。该版本还显著提升了代码转换、编辑能力和复杂智能体的表现,并通过Google AI Studio和Vertex AI向开发者开放。
Google DeepMind发布的Gemini 2.5 Pro在LMArena多个AI竞技场全面领先,实现文本、视觉和Web开发领域的统治地位。该版本还显著提升了代码转换、编辑能力和复杂智能体的表现,并通过Google AI Studio和Vertex AI向开发者开放。
Nvidia开源最新语音识别模型Parakeet TDT 0.6B,能在1秒内完成60分钟音频转录,并以CC-BY-4.0许可协议开放源代码。该模型在Open ASR排行榜上表现优异,RTFx性能达到3380倍。
DeepSeek联合创始人Jack Clark在采访中表示,其炒作可能有点夸大了。Anthropic认为DeepSeek只是一个’有能力的工程师和研究人员团队’,实际实力落后美国前沿公司约6-8个月,并指出DeepSeek的技术还未能让国家安全人士感到担忧。
身份验证将成为AGI时代的核心痛点,OpenAI CEO Sam Altman提出,在AGI时代身份认证将变得前所未有的重要。他参与创建World项目,旨在确保人类在AI扩散时代仍然保持存在感和核心地位。
计算机科学家Stuart Russell认为大型语言模型(LLM)不会导致通用人工智能(AGI),多数AI研究人员也持相似观点。Russell预测未来AI公司会探索替代方法,政府可能不会采取行动。他认为最坏的情况是「切尔诺贝利规模的灾难」,需要人类醒来并采取措施。
Anthropic宣布Claude新增Integrations和Advanced Research功能,让AI能够连接用户的工作环境并进行深入研究。通过这些更新,Claude将作为工作伙伴而非单纯的对话助手出现。
开源AI研究者质疑Chatbot Arena排行榜,指存在暗箱操作和数据获取不平等现象。研究发现大公司享有未公开的测试特权,并从多个变体中挑选表现最佳版本发布,导致排名失真。研究还指出数据分配极不均衡,对开放模型支持不足。这些行为可能误导AI社区,需进行改革以恢复公平性和可信度。