95后北大校友挑起ChatGPT Agent大梁!今年刚博士毕业,曾获陶哲轩支持的AIMO第二名
OpenAI发布会C位被华人占据,孙之庆、马丁(MengTian)李和张熙堃等华人员工参与重要项目。小扎挖角多名OpenAI研究员后引起关注,首席研究官Mark Chen离职加入Meta,Alexandr Wang成为全球最年轻的亿万富豪之一。
OpenAI发布会C位被华人占据,孙之庆、马丁(MengTian)李和张熙堃等华人员工参与重要项目。小扎挖角多名OpenAI研究员后引起关注,首席研究官Mark Chen离职加入Meta,Alexandr Wang成为全球最年轻的亿万富豪之一。
国产开源统一图像生成模型OmniGen2发布,显著增强了上下文理解能力、指令遵循能力和图像生成质量。它支持文生图、图像编辑和主题驱动图像生成,并通过全面开源训练数据和权重等资源促进开发者参与。
Flux Kontext Dev ComfyUI 首日支持发布,提供强力图像编辑能力,整合了角色一致性生成、本地运行等特性,提升创作者和开发者的创作自由度与可控性。
本文介绍了一种新的图像生成方法TransDiff,它结合了AR Transformer和Diffusion模型,并提出了Multi-Reference Autoregression(MRAR)范式。TransDiff使用较小的Diffusion Decoder显著降低参数量,同时在基准测试中表现出色。
kGIT 方案做生成的生成理解统一模型。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
太长
OpenAI 收购 io 并发布支持 MCP 的 Responses API,简化智能体开发与管理,包括支持 Mckey Platform、图像生成、Code Interpreter 和文件搜索工具更新等功能。
Manus 推出图像生成功能,能够理解用户意图并生成相关图像及网站。通过机器学习技术,用户可以自由修改任务内容和设计风格。尽管某些任务处理速度较慢,但整体效果令人满意。