什么样的魔力让Gemini 2.0 爆冷抢了OpenAI风头,开辟LLM应用2025新方向

OpenAI直播活动热度下降,主要因苹果产品接入OpenAI服务的消息被Google Gemini 2.0发布抢走风头。Gemini 2.0模型参数量约8亿,性能强大且支持多模态交互。虽然部分功能在线免费试用中,但生图能力受限于内部员工访问权限。总体而言,Google的实时多模态技术或将革新AI应用交互模式。

李飞飞:视觉智能的三层阶梯

两位AI研究巨擘在NeurIPS会议上讨论时发现「视觉智能三阶阶梯」与Pearl因果推理阶梯有相似之处。李飞飞表示受到Pearl著作《为什么》启发,并称「视觉智能阶梯」灵感源自Pearl的理论,展示出AI各领域潜在联系和普遍规律。

谷歌Gemini 2.0归来仍然是Agentic!

谷歌发布Gemini 2.0 Flash AI多模态模型,在快速响应下提供增强性能,支持图像、视频及音频等多模式输入输出,能调用Google搜索和代码执行工具。项目Astra探索通用AI助手功能,Project Mariner从浏览器开始研究人机交互未来;Jules帮助开发人员。