刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
谷歌在MWC上推出Project Astra与Gemini Live集成的新AI功能,包括屏幕共享和实时视频回答问题。这些功能提升了实时人工智能交互的能力,使Gemini Live能够更好地理解和响应用户的需求。
谷歌在MWC上推出Project Astra与Gemini Live集成的新AI功能,包括屏幕共享和实时视频回答问题。这些功能提升了实时人工智能交互的能力,使Gemini Live能够更好地理解和响应用户的需求。
谷歌AI产品NotebookLM新增交互式思维导图功能。用户可以通过它整理视频、PDF等长内容,并生成可视化脑图,点击互动即可获取重点信息。新功能备受好评,适合学习和创作辅助。
谷歌DeepMind高级研究科学家Pete Florence创建新公司,专注于机器人技术。目标是制造能做任何事情的机器人,让体力劳动边际成本接近零。该公司已获得英伟达投资。
MLNLP社区介绍了谷歌 Gemini 2.0系列模型的原生多模态输出能力,特别是其绘画功能。Gemini 2.0实现了文本与图像的一致生成,并通过多次对话实现复杂场景的精细调整。Gemini 2.0在保持一致性方面表现出色,可应用于电商批量生成图片、产品设计等多个领域。
17 日发布 R2 模型为不实消息,公司尚未公布具体发布时间和技术细节。市场预期或在 5 月发布。