深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理
图片来源:
latent space
Z highlights
OpenAI
的实时
API
支持低
图片来源:
latent space
Z highlights
OpenAI
的实时
API
支持低
OpenAI今日发布ChatGPT Vision新功能,支持视频通话、屏幕共享及与圣诞老人聊天。用户可利用高级语音模式进行互动,并在未来一周内使用屏幕共享功能。谷歌Gemini 2免费提供多模态体验,性能强劲且免费。这是自ChatGPT发布以来,谷歌首次成功狙击OpenAI。
谷歌发布新一代系列模型Gemini 2.0 Flash,强调低延迟和高性能,并支持多模态输入输出、原生工具调用等能力;同时发布了多个AI Agent助手原型,旨在引领AI进入Agentic时代,强调更强的主动性和行动力。
Lumen Orbit,一家太空数据中心初创公司,在短短几天内完成了1.1亿美元种子轮融资,并计划在2024年底启动多吉瓦计算集群。该公司专注于通过发射由舱体组成的轨道数据中心来吸收太阳能量,减少地面数据中心的电费和电力限制问题。
深圳想法流科技完成A轮融资,由锦秋基金领投。公司专注于多模态AI驱动的新一代内容平台,推出交互式虚拟角色体验产品。此次融资将加速技术研发和市场拓展。
Ayar Labs 获得英伟达、AMD Ventures 和 Intel Capital 等半导体公司投资,筹集1.55亿美元用于开发利用光加速数据传输的人工智能解决方案。
Devin通过Slack交互完成编码任务,能成功运行模型并生成图片;但工作流程较慢且不理想,可靠性有待提高。相比之下,Cursor代理自动扫描代码库更方便,其功能类似,但使用体验更好。总体来看,个人更看好Cursor的增量式方法。
OpenAI的ChatGPT与苹果合作正式登陆iPhone、iPad和Mac平台。通过Siri集成、写作工具集成和相机控制集成等方式,用户可以更便捷地使用ChatGPT,包括直接创作文档和进行视觉智能识别等新功能。
谷歌推出Gemini 2.0 Flash模型,支持多模态输入输出、Agent和高级代理功能,免费提供给开发者使用。该模型速度更快,性能更强大,还能调用Google工具和第三方函数。