小兵的AI视界，作者每时AI

UFO²：微软开源的 Windows 桌面 Agent 操作系统，开启智能自动化新时代

2025年5月2日19时作者小兵的AI视界

公司推出的
UFO
²（
UFO Squared
），是一个面向
Windows
桌面的多智能体操作

2025年5月1日14时作者小兵的AI视界

北京航空航天大学推出的小尺寸视频推理模型TinyLLaVA-Video-R1通过强化学习显著提升了小规模模型的性能，并开源了权重、代码和训练数据。该模型参数量不超过4B，在多个基准测试中表现优异，具备强大的多模态理解能力和可解释性生成能力。

2025年4月30日14时作者小兵的AI视界

，
AI
模型的能力不断提升。然而，现有的视频生成模型在提示词遵循、视觉质量、运动动态和视频时长等方

2025年4月29日19时作者小兵的AI视界

狂飙，碾压一众顶尖对手
，
开源仅
3
小时，
GitHub
狂揽
17k
星，热度席卷全球！
一、

2025年4月29日14时作者小兵的AI视界

上海AI Lab推出的Infinite Mobility模型使用程序化生成技术高效生成高质量可交互物体数据，支持22类常见物体，单个物体生成仅需约1秒，成本低至0.01元。

2025年4月28日14时作者小兵的AI视界

知识和大量的时间，而新兴的
AI
驱动的
3D
生成技术正在改变这一局面。
阿里巴巴通义实验室最近开

2025年4月27日14时作者小兵的AI视界

模型越来越能够生成自然、逼真的语音，为各种应用场景提供了强大的支持。
最近，由两名韩国研究者组建的

2025年4月26日14时作者小兵的AI视界

疗场景的复杂性和对准确性的极高要求，使得开发专门针对医学推理的大模型成为必然趋势
。
HuatuoG

2025年4月25日14时作者小兵的AI视界

上海 AI Lab 开源的 Aether 项目通过三维时空建模和多模态融合技术，实现了生成式世界模型在虚拟数据上的出色表现，并具备对真实世界的零样本泛化能力。

2025年4月24日14时作者小兵的AI视界

FastMCP 是一款 Python 开源库，简化 MCP 服务器构建流程。通过简洁高效的方式定义工具和资源，显著减少代码量，支持快速开发、简洁易用和完整的 MCP 协议实现等功能。