微软
微软开源的纯视觉GUI电脑屏幕解析工具升级了,速度和准确率大幅提升。
OmniParser V2发布,准确率提升和推理速度加快。OmniParser通过视觉解析界面元素,支持大语言模型,提供高效跨平台自动化解决方案。
复旦视频扩散模型综述:覆盖300+文献,探讨近期研究趋势与突破,Github揽星2k+
复旦团队发表综述论文《A Survey on Video Diffusion Models》,系统梳理扩散模型在视频生成、编辑及理解领域的进展,涵盖300+文献。
手掌大小芯片碾压全球算力!微软量子计算核弹级突破,纳德拉:构建全新物质状态
微软发布首款基于马约拉纳新粒子的量子芯片,有望数年内实现百万量子比特计算。该芯片通过拓扑超导体技术保护和读取量子信息,但物理学家质疑其验证过程。