实测谷歌Gemini 2.0:数数、推理翻车,多模态惊艳,编程输Claude
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。
谷歌三位CEO联合宣布Gemini 2.0 Flash发布,性能超越Gemini 1.5 Pro,并在多模态能力上表现出色。但在经典题目的推理和编程能力测试中表现一般,实测结果引人思考。
Sora Turbo即将发布,支持生成一分钟视频、多场景切换和角色一致性。OpenAI在最新发布会上展示了Sora的强大功能及其编辑能力,包括Remix、Re-Cut和Blend技术。
美国科技公司CEO表示,在伦敦举行的C21Media主题演讲中,OpenAI的Chad Nelson展示了即将推出的Sora v2的部分功能特性。Sora v2包括文本生成视频、图像生成视频、视频编辑生成和视频间转换等功能。
斯坦福大学以人为本人工智能研究院(HAI)联席主任李飞飞在《经济学人》专栏中指出,基于视觉的智能或空间智能是人工智能领域的新前沿。她认为这是下一代AI的关键所在,能够通过文本提示控制机器人、生成图像和视频,并在未来应用如家庭护理、手术辅助及教育培训中发挥重要作用。
周鸿祎发布360新产品‘纳米搜索’,主打一切皆可生成视频。通过多模态搜索、学习总结、写作改写等功能简化数字人和视频创作过程。但体验尚有改进空间。