Transformer
16年磨一剑!三位图灵奖大咖力荐的深度学习书有中文版了!
一本好的教材兼具体量恢弘与思想深邃,《深度学习:基础与概念》就是这样的一本经典入门书籍,作者Christopher M.Bishop长期深耕人工智能领域,并获得多位AI领域的重量级专家推荐。
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转
本文介绍了一篇CVPR 2025 Highlight论文《CrossFlow》及其相关工作,该研究提出了一个新的跨模态生成框架,并在多个任务上取得了媲美甚至超越最优算法的性能。
CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解
CoGenAV 框架结合 ResNet 3D CNN 和 Transformer 编码器提取音视频特征,并通过对比生成同步训练提升模型理解能力,实现‘听清+看懂’多模态理解。
又一个AI大模型的新方向,爆了…
2025年伊始,AI技术迅猛发展改变程序员职业。阿里云等企业引入大模型开发能力要求,未来企业更看重能用AI重构业务的技术人才。文章指出传统岗位缩水,而AI相关岗位需求激增,薪资上涨150%。推荐免费课程帮助掌握AI大模型原理、应用技术和项目经验,提升竞争力。
通俗易懂看技术:24张流程图直观理解LLM、RAG及Agent
2025年5月24日周六,北京晴天。本文总结了大模型微调与训练、RAG及AgenticRAG等7张图,以及Agent、MCP和Functioncall的9张图。这些内容可供参考并作为验证标准,有助于深度思考和体系化学习。
ICML 2025 Spotlight|南洋理工陶大程教授团队等提出基于RAG的高分辨率图像感知框架,准确率提高20%
模型(MLLMs)在视觉问答、推理以及 OCR 等任务上取得了显著的成功。然而,早期的 MLLMs
火爆全网!《LLM书》.PDF
本书介绍生成式人工智能项目生命周期,涵盖模型选择、微调和部署等内容。通过直观示例和技术库指导读者掌握Transformer和Diffusers等工具。同时介绍了大模型前沿课程、顶会论文idea以及学术辅导服务。
生成理解统一模型解读 (四):JanusFlow:使用 Rectified Flow 做生成的 Janus
解统一架构 Janus 的后续版本,借助 Rectified Flow 做生成。
>>
加入极市CV