微软开源多模态AI基础模型!13位作者12位华人,丝滑操控电脑和机器人

微软研究院发布首个多模态AI agents基础模型Magma,能够理解环境、规划行动并在数字及物理空间中执行任务。它以视觉语言(VL)模型为基础,能完成从UI导航到机器人操作等各种agent任务。

速递|Cohere年化收入三倍增长,初创公司考虑出售员工股票,或将进行E轮融资

Cohere作为最早获得风险投资的人工智能模型开发者之一,在过去一年中年化收入达到7000万美元,增长三倍多。公司高管考虑允许出售员工股份以吸引投资者,预计近期将进行一轮E系列主要融资。

前端程序员请注意!首个截图就能生成现代前端代码的AI来了 已开源

首个面向现代前端代码生成的多模态大模型Flame开源,能够自动生成符合现代前端开发规范和动态交互性的高质量代码。通过数据合成方法解决数据稀缺问题,Flame展示了与顶级模型如GPT-4o相比在代码生成方面的显著优势。