又一个世界顶级国产AI绘画大模型:HiDream
中国团队HiDream智象未来开源了图像生成大模型HiDream-I1和交互编辑模型HiDream-E1,实现了对话到图像创作的闭环。HiDream-I1在权威榜单中登顶,并刷新了行业记录。
中国团队HiDream智象未来开源了图像生成大模型HiDream-I1和交互编辑模型HiDream-E1,实现了对话到图像创作的闭环。HiDream-I1在权威榜单中登顶,并刷新了行业记录。
OpenAI发布了两款新的推理模型o3和o4-mini,能够处理复杂的编程和视觉任务,并首次实现了‘图像思维’能力。这些模型提供了更快、更高效且更具成本效益的解决方案,向开源方向迈进的同时也推出了Codex CLI智能体以帮助用户执行编程任务。
文章讨论了用户对AI模型(如ChatGPT和OpenAI)说“请”、“谢谢”等礼貌用语的影响。有人认为这可以提高AI的表现,但也有人指出这只是浪费电力。通过计算发现,这些短语确实增加了额外的电费成本。作者提出这个问题是否真的有意义,并分享了不同人的观点和估算结果。总的来说,礼貌对待AI是一种习惯和本能,尽管其影响存在争议,但似乎并未被证明对AI输出质量有显著影响。
近日,OpenAI发布了Codex CLI工具,它能够直接在终端运行,并实现了‘推理-执行-验证’的完整闭环。该工具的核心优势在于其多模态引擎和高效的安全机制。Codex CLI正在改变开发者的工作方式,特别是在处理遗留代码迁移任务时效率提升显著。此外,通过开源策略,OpenAI也展示了未来开发工具生态进化的重要方向。
文章介绍了字节跳动发布的新模型豆包1.5和视觉版Doubao-1.5-thinking-pro-vision,并展示了它们在推理位置、根据冰箱内容定制食谱、判断车祸原因以及家居改造建议等方面的出色表现,对比了与OpenAI o3的差异。
香港科技大学开发的 AudioX 机器学习模型能够根据用户的个性化输入生成独一无二的音频和音乐作品,包括文本、视频、图像等多模态数据,具有强大的跨模态学习能力,并能处理复杂的音频生成任务如音乐补全、修复等。
Grok Studio 是一款革命性的AI编程工具,支持Python代码执行、Google Drive集成和游戏开发等功能。它还提供智能文档生成、实时代码执行、协同办公整合等特性,并展示了浏览器游戏开发和数据仪表板设计能力。
OpenAI 创始人 Sam Altman 宣布 o3 和 o4-mini 双模型同步上线,两款模型具备’视觉思考’能力,开启 AI 视觉推理新纪元。o3 模型速度提升24%,错误率下降39%;o4-mini 支持全面的图像理解能力和复杂推理,将引领AI视觉推理的新时代。