量子位
前端程序员请注意!首个截图就能生成现代前端代码的AI来了 已开源
首个面向现代前端代码生成的多模态大模型Flame开源,能够自动生成符合现代前端开发规范和动态交互性的高质量代码。通过数据合成方法解决数据稀缺问题,Flame展示了与顶级模型如GPT-4o相比在代码生成方面的显著优势。
Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
微信DeepSeek入口已接通,辐射用户14亿!刚刚实测,辛弃疾都得666
微信正式接入DeepSeek-R1,并支持满血版AI搜索。用户可通过微信搜索获取答案,生成结果带有社交属性可分享给朋友或朋友圈。此次接入不仅满足了用户的即时需求,还展示了微信与大模型R1的深度融合。
DeepSeek官方推荐:R1要这样设置
DeepSeek官方推荐部署DeepSeek-R1的四项内容:不使用系统提示词,把Temperature设置为0.6,提供缓解模型绕过思维的指南,并引入新的官方提示搜索和文件上传功能。
腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
腾讯元宝接入DeepSeek-R1满血版,并支持联网搜索。它现在可以自由选择使用混元模型或DeepSeek-R1,覆盖微信公众号等腾讯生态信息源,提升了用户交互体验和知识准确性。
Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型
Meta GenAI团队提出的新框架VideoJAM显著提升了视频生成中的运动一致性,其效果超越了Sora等模型。VideoJAM能够处理复杂且迅速的动作,并与现有DiT模型无缝集成,提升运动质量达19.67%至4.88%。
多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源
Align-DS-V团队投稿
量子位 | 公众号 QbitAI
如果把DeepSeek-R1震撼硅谷
宇树机器人成赛博科比!英伟达CMU新研究,投篮模仿篮球巨星,代码论文全开源
英伟达、卡内基梅隆大学团队通过ASAP方法解决了机器人敏捷动作训练难题,实现了宇树人形机器人的高难度动作表现。该框架分为预训练运动跟踪策略和差异动作模型两阶段,显著提高了机器人的灵活性和全身协调性。