OpenAI发布季第六天 :GPT-4o 实时视频通话、屏幕共享、圣诞老人限定语音

OpenAI发布Advanced Voice with Vision功能,让ChatGPT能够通过视觉和听觉与用户互动。新功能包括实时视频通话、屏幕共享及圣诞老人限定语音,提升工作效率和用户体验。

再也不怕显存爆炸了!高效重建「几何精准」的大规模复杂三维场景,中科院提出CityGaussianV2

中科院自动化所提出CityGaussianV2算法,以2DGS为基元,解决大规模复杂场景重建中收敛速度和扩展能力问题,并实现高效并行训练和压缩,显著降低模型训练成本。

Gemini 2.0刚发布多模态模式马上开源,自动生成模仿X上用户的AI对话机器人,独立艺术生成设备PaperPiAI

文章介绍了5个项目:Gemini Multimodal Live API + Pipecat聊天应用入门套件、MCP Directory Minecraft服务器目录、PaperPiAI基于Raspberry Pi的独立艺术生成系统、Research Rabbit AI驱动网络研究助手以及Reply gAI个性化回复工具。