今年最火 AI 视频 Veo 3 大更新!上传一张图,家里的猫和鲁迅就能开口「吐槽」 附实测

VeO3 最新更新支持图片生成开口说话的视频,包括声音和动作。用户能上传一张静态图片加上文字脚本,就能生成带有语音同步的视频。Gemini 平台提供了多种选项如首帧转视频、使用 Gemini 和 Flow 生成连贯短片等。

苹果宣判推理模型死刑!Google CEO:忘了AGI吧,先用好AJI

苹果研究员通过一系列全新智力测试题,揭示了多种「推理」模型在高复杂度问题上的无效性。研究发现这些模型实际上是高级版的记忆大师,并且在训练时无法理解实际情况中的问题。Google CEO Sundar Pichai提出AJI(Artificial Jagged Intelligence)概念,描述当前AI处于「惊艳与弱智并存」的状态。Pichai预测到2030年将看到巨大进步,但强调重要的是利用现有能力带来积极影响。

谷歌发布MedGemma,基于Gemma 3构建,专攻医学文本与图像理解

HyperAI超神经上线教程板块,提供一键部署MedGemma-27b-text-it医学推理大模型教程。该模型支持医疗文本理解与临床推理任务,如病人问诊、分诊等。HyperAI还为新用户准备了注册邀请码福利。

NotebookLM 音频“说中文”了,AI帮助积累资料、生成大纲、挖掘洞见,网友:被低估的神器。

Google CEO Sundar Pichai 推出了NotebookLM新功能:Audio Overviews (音频概述),支持50多种语言,包括中文。NotebookLM能将上传的资料生成引人入胜的“深度探讨”音频总结,支持多种格式文件。