【CUDA编程】手撸一个大模型推理框架 FasterLLaMA 2024年12月27日8时 作者 极市干货 写在前面 :之前笔者写过 4 篇关于 Nvidia 官方项目 Faster Transformer
超越ControlNet++!腾讯优图提出动态条件选择新架构 2024年12月27日8时 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨极市平台粉丝 编辑丨极市平台 极市导读 腾讯优图提出Dynami
人大高瓴发布FlashRAG-Paddle!基于PaddleNLP的高效开发与评测RAG框架 2024年12月26日20时 作者 PaperWeekly 论文标题: FlashRAG: A Modular Toolkit for Efficient Re
AAAI 2025 港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制 2024年12月26日20时 作者 PaperWeekly 本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——Spa
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级 2024年12月26日20时 作者 机器之心 AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000
微软亚洲研究院发布MMLU-CF:无污染的大语言模型理解基准来了! 2024年12月26日20时 作者 PaperWeekly 微软亚洲研究院推出MMLU-CF,一个基于公开数据源且去污染设计的大语言模型理解基准,旨在提供更为准确、公平的评估。
围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创 2024年12月26日18时 作者 机器之心 机器之心原创 作者:吴昕 终于,谷歌新一代视频生成大模型 Veo2 把 Sora 给秒了: 「更懂人
中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线 2024年12月26日18时 作者 机器之心 机器之心发布 机器之心编辑部 在当今迅速发展的人工智能时代,大语言模型(LLMs)在各种应用中发挥着