学术归档 - 第240页共283页

【CUDA编程】手撸一个大模型推理框架 FasterLLaMA

2024年12月27日8时作者极市干货

写在前面
：之前笔者写过 4 篇关于 Nvidia 官方项目 Faster Transformer

2024年12月27日8时作者极市干货

↑ 点击
蓝字
关注极市平台
来源丨机器之心
极市导读
写代码时，应该考虑之后阅读者和维护者能否更轻

2024年12月27日8时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨极市平台粉丝
编辑丨极市平台
极市导读
腾讯优图提出Dynami

2024年12月26日20时作者 PaperWeekly

论文标题：
FlashRAG: A Modular Toolkit for Efficient Re

2024年12月26日20时作者 PaperWeekly

本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——Spa

2024年12月26日20时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000

2024年12月26日20时作者 PaperWeekly

微软亚洲研究院推出MMLU-CF，一个基于公开数据源且去污染设计的大语言模型理解基准，旨在提供更为准确、公平的评估。

2024年12月26日18时作者机器之心

机器之心报道
编辑：蛋酱、陈陈
最近，类 o1 模型的出现，验证了长思维链 (CoT) 在数学和编码

2024年12月26日18时作者机器之心

机器之心原创
作者：吴昕
终于，谷歌新一代视频生成大模型 Veo2 把 Sora 给秒了：
「更懂人

2024年12月26日18时作者机器之心

机器之心发布
机器之心编辑部
在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着