日期: 2025 年 6 月 29 日
Kontext 模型超强图像编辑能力
Flux Kontext Dev ComfyUI 首日支持发布,提供强力图像编辑能力,整合了角色一致性生成、本地运行等特性,提升创作者和开发者的创作自由度与可控性。
中科院甩出多模态“核弹”!类GPT-4o多模态模型开源!支持语言-视觉-语音任意组合交互!
中国科学院计算技术研究所开源了一款名为Stream-Omni的多模态模型,支持文本、图像和语音交互,生成文本和语音回复。其核心在于高效模态对齐技术,仅需少量数据即可训练,并提供无缝的‘边听边看’体验。
一场没有遥控手柄的机器人足球赛,担架员成了最忙碌的人
人形机器人在一场3V3足球比赛中摔倒后需担架员抬离场地。加速进化旗下的T1机器人依靠视觉传感器、算法决策及运动控制实现自主运行。比赛中展示出复杂的技术能力,但仍存在技术瓶颈。该比赛吸引了多个赞助商和观众到场观看,为未来商业运营探索路径。
首发丨美团悄咪咪公测 AI 袋鼠参谋 App
文章介绍了美团推出的新产品——袋鼠参谋,它是一款基于AI大模型决策能力的应用,旨在帮助商家解决开店难题。通过分析数据和知识检索,提供选址、菜品研发等场景的智能经营建议。
突发!小扎“突袭”OpenAI核心,四名顶尖华人被挖走
Meta正尽全力组建超级智能研究团队,已从OpenAI挖来4名顶尖华人研究员,包括Jiahui Yu、Hongyu Ren等。这些研究员在多模态模型后训练等方面有深厚造诣。