前端程序员请注意!首个截图就能生成现代前端代码的AI来了 已开源

首个面向现代前端代码生成的多模态大模型Flame开源,能够自动生成符合现代前端开发规范和动态交互性的高质量代码。通过数据合成方法解决数据稀缺问题,Flame展示了与顶级模型如GPT-4o相比在代码生成方面的显著优势。

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。

微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666

微信正式接入DeepSeek-R1,并支持满血版AI搜索。用户可通过微信搜索获取答案,生成结果带有社交属性可分享给朋友或朋友圈。此次接入不仅满足了用户的即时需求,还展示了微信与大模型R1的深度融合。

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

Meta GenAI团队提出的新框架VideoJAM显著提升了视频生成中的运动一致性,其效果超越了Sora等模型。VideoJAM能够处理复杂且迅速的动作,并与现有DiT模型无缝集成,提升运动质量达19.67%至4.88%。

宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源

英伟达、卡内基梅隆大学团队通过ASAP方法解决了机器人敏捷动作训练难题,实现了宇树人形机器人的高难度动作表现。该框架分为预训练运动跟踪策略和差异动作模型两阶段,显著提高了机器人的灵活性和全身协调性。