Gemini 2.0发布了,可惜的是关注的人很少

谷歌发布 Gemini 2.0 Flash 大模型,具有生成文本、图像和语音等多模态能力,性能优于前代产品,谷歌 CEO Sundar Pichai 称其为新的代理时代建模,可应用于 Android 手机视觉助手、游戏开发及编程任务等场景。

谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议

薛复昭博士分享了他在学术生涯中的七点心得,包括工程能力的重要性、与优秀人才合作、专注于重要论文、研究趋势的演变、换位思考以及博士学位的价值。他指出,虽然攻读博士学位有助于科研技能的学习,但不是从事大语言模型研究的必要条件。

Flux模型PuLID换脸工作流

字节的Flux PuLID 0.91版更新,相比前版速度更快。PuLID通过结合Lightning T2I分支和扩散分支,并引入对比对齐损失和精确的身份ID损失来实现高效身份ID定制,保持图像元素一致。优点是速度快、保真度高;缺点是换脸动作单调。