月度归档: 2025 年 3 月
速递|Google推出新AI模型,Gemini Robotics可实现多硬件机器人语音操控
Google DeepMind发布AI模型Gemini Robotics,使机器人能够在不同环境下执行任务。
速递|Moonvalley 发布了一款视频生成器,声称其基于授权内容训练
LunaMover是一家洛杉矶初创公司,推出了名为’Marey’的AI视频生成模型。该模型基于公开许可数据训练,并能精细控制场景中的动作。Moonvalley声称其风险较低,允许创作者请求内容移除和删除数据。
喝点VC|a16z剖析2024年AI语音发展:产品数量激增、B2B垂直应用为重点
AI语音在2024年下半年迎来爆发式增长。模型开发进步简化了基础设施,使语音Agent延迟更低、性能更优。GPT-4o API价格大幅下调至$2.50/Million tokens。语音Agent市场渗透率上升,集成到更多产品中。早期应用主要集中在金融服务、BPO、保险、政府和医疗等领域。
谷歌连推两款「机器人大脑」!Gemini Robotics:折纸、扣篮、装饭盒不在话下
谷歌DeepMind发布Gemini Robotics和Gemini Robotics-ER两款AI模型,让机器人能理解复杂环境、执行精细任务,并具有更好的泛化能力、交互性和灵活性。