AI先锋官
实测谷歌Gemini 2.0:数数、推理翻车,多模态惊艳,编程输Claude
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。
新增视频编辑功能,OpenAI最大期货Sora兑现,奥特曼称其视频版 GPT-1
Sora Turbo即将发布,支持生成一分钟视频、多场景切换和角色一致性。OpenAI在最新发布会上展示了Sora的强大功能及其编辑能力,包括Remix、Re-Cut和Blend技术。
Sora v2即将发布,支持生成一分钟视频、多场景切换、完美的角色一致性
美国科技公司CEO表示,在伦敦举行的C21Media主题演讲中,OpenAI的Chad Nelson展示了即将推出的Sora v2的部分功能特性。Sora v2包括文本生成视频、图像生成视频、视频编辑生成和视频间转换等功能。
李飞飞《经济学人》撰文:AI 革命始于大语言模型,下一步是基于视觉的空间大模型
斯坦福大学以人为本人工智能研究院(HAI)联席主任李飞飞在《经济学人》专栏中指出,基于视觉的智能或空间智能是人工智能领域的新前沿。她认为这是下一代AI的关键所在,能够通过文本提示控制机器人、生成图像和视频,并在未来应用如家庭护理、手术辅助及教育培训中发挥重要作用。