西湖 AGI Lab 发布 Detail++:多分支细节注入重塑复杂 Prompt 文生图体验
西湖大学 AGI Lab 推出 Detail++,无需训练即可显著提升复杂 Prompt 场景下的图文一致性与细节还原。通过分层子提示、渐进注入和注意力共享策略,Detail++ 能够有效避免属性溢出、错配及风格混合问题。
西湖大学 AGI Lab 推出 Detail++,无需训练即可显著提升复杂 Prompt 场景下的图文一致性与细节还原。通过分层子提示、渐进注入和注意力共享策略,Detail++ 能够有效避免属性溢出、错配及风格混合问题。
阿里巴巴达摩院开源文生图模型Qwen-Image,参数200亿,支持多种风格生成、编辑和转换。性能超越FLUX.1,在GenEval等测试中表现优异。
地平线提出Epona,融合扩散与自回归模型,在单一框架下实现分钟级长视频生成、轨迹控制生成和实时运动规划。
谷歌与Kaggle联合推出Game Arena平台,以战略游戏评估AI模型。8月5日将举行首次LLM象棋比赛,八大顶尖AI模型参与,包括谷歌、OpenAI等。平台开放且透明,可测试通用问题解决能力。
小米发布MiDashengLM-7B音频模型,通过统一理解语音、环境声与音乐的跨领域能力提高用户场景理解的泛化性。该模型基于公开数据集进行预训练和有监督微调,展示了在多项关键任务上的优势,并支持在边缘设备上部署。
csdn.net
在巨头用千亿美金构筑技术壁垒的时代,开源 AI 还有未来吗?
来自艾伦人工智能研究
Lovable是一款无需编程的AI应用构建工具,而Dyad则是一个免费、本地运行的开源替代方案。它支持多种AI模型,并提供Supabase集成和本地开发体验。
美国人工智能公司Anthropic因OpenAI违反服务条款,切断了后者对Claude系列AI模型的API访问权限。 Anthropic指控OpenAI在GPT-5发布前使用Claude进行内部测试。这是AI编程能力对决的开始,双方争夺开发者市场的主导地位。
长三角(昆山)具身智能产业发展暨开发者大会成功举办,400多位专家、企业代表参会。活动包含1场开发者大会、1个应用场景展区、1场研讨会和4场供需对接会,发布了场景应用大赛优胜团队及创新成果,并推动产业从技术研发迈向实践落地。