路过银河AI
一句话P图:ComfyUI OmniGen2 原生工作流
Flux Kontext dev实现了一句话P图自由,ComfyUI更新了OmniGen2工作流。OmniGen2是一个7B参数量的强大模型,支持文本生成图像和基于指令的图像编辑。
Flux Kontext Dev发布,免费开源一句话P图的时代到来了!
Flux Kontext Dev终于发布开源版本支持一句P图功能,但需要至少20G显存。本文详细介绍了如何使用基础版和带DeepSeek中文翻译版工作流进行操作,并分享了加载模型、处理图片的基本步骤以及各种常见功能演示,同时提供了官方提示词技巧和解决常见问题的方法。
月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
距离人类不需要写作的时间点指日可待。基于AI生成的中国石化分析报告详实、专业,包含文字及可视化材料。作者强调人应专注在想象力与创造力方面。
谷歌发布音乐模型!
Magenta RealTime 是一个开源音乐生成模型,由 Google 开发,能够在资源有限的环境中部署。它基于 SoundStream RVQ 编解码器和 MusicCoCa 模型工作原理。
完美夏日,完美身材:Pony Realism上新
今日特别推荐V2.3 ULTRA版本,提升整体输出效果并带来更自然且平衡的光影效果、强化皮肤细节及真实感。包括赛博皮衣女孩、紫色头发少女、蒙眼女子等多款模型。
特斯拉前人工智能和自动驾驶主管:氛围编程
特斯拉前人工智能主管Karpathy探讨了LLM的发展历程及应用前景,将其比喻为’软件3.0′:提示词时代,并提出了构建’部分自治’产品和为智能体服务的基础设施的创业机会。