跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

学术

【CUDA编程】手撸一个大模型推理框架 FasterLLaMA

2024年12月27日8时 作者 极市干货

写在前面
:之前笔者写过 4 篇关于 Nvidia 官方项目 Faster Transformer

分类 学术 标签 cuBLAS、 CUDA算子、 FasterLLaMA、 INT8量化、 MHA、 Top-k解码 发表评论

写代码的时候,请心疼一下读代码的同事

2024年12月27日8时 作者 极市干货

↑ 点击
蓝字
关注极市平台
来源丨机器之心
极市导读
写代码时,应该考虑之后阅读者和维护者能否更轻

分类 学术 标签 依赖倒置原则、 数据集整理、 新手融入、 模块化设计、 简化系统架构、 认知负荷 发表评论

超越ControlNet++!腾讯优图提出动态条件选择新架构

2024年12月27日8时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨极市平台粉丝
编辑丨极市平台
极市导读
腾讯优图提出Dynami

分类 学术 标签 LLaVA模型、 T2I任务、 动态选择、 可控性提升、 多控制适配器、 高效条件评估器 发表评论

人大高瓴发布FlashRAG-Paddle!基于PaddleNLP的高效开发与评测RAG框架

2024年12月26日20时 作者 PaperWeekly

论文标题:
FlashRAG: A Modular Toolkit for Efficient Re

分类 大模型、 学术 标签 FlashRAG-Paddle、 PaddleNLP、 国产硬件、 复现模型、 新方法研究、 检索增强 发表评论

AAAI 2025 港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制

2024年12月26日20时 作者 PaperWeekly

本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——Spa

分类 大模型、 学术 标签 Dense Ganglion Connections、 DenseNet、 Mamba-T、 SparX、 效能、 特征表达 发表评论

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

2024年12月26日20时 作者 机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000

分类 学术、 资讯 标签 FP32、 INT4、 INT8、 SageAttention2、 平滑处理、 精度 发表评论

微软亚洲研究院发布MMLU-CF:无污染的大语言模型理解基准来了!

2024年12月26日20时 作者 PaperWeekly

微软亚洲研究院推出MMLU-CF,一个基于公开数据源且去污染设计的大语言模型理解基准,旨在提供更为准确、公平的评估。

分类 大模型、 学术 标签 GPT-4o、 Llama-3.3-70B-instruct、 MMLU-CF、 Qwen2.5-72B-instruct、 大语言模型评估基准数据集、 微软亚洲研究院 发表评论

引入长思维链!微信基于阿里千问大模型搞出个翻译版o1

2024年12月26日18时 作者 机器之心

机器之心报道
编辑:蛋酱、陈陈
最近,类 o1 模型的出现,验证了长思维链 (CoT) 在数学和编码

分类 学术、 资讯 标签 CometScore、 DRT-o1-7B、 O1 类 CoT 数据、 Qwen2.5-7B-Instruct、 机器翻译、 长思考过程 发表评论

围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创

2024年12月26日18时 作者 机器之心

机器之心原创
作者:吴昕
终于,谷歌新一代视频生成大模型 Veo2 把 Sora 给秒了:
「更懂人

分类 学术、 资讯 标签 AI、 MidiRender、 专业编辑、 大模型、 社交平台、 音乐创作 发表评论

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集,仅三个大模型达及格线

2024年12月26日18时 作者 机器之心

机器之心发布
机器之心编辑部
在当今迅速发展的人工智能时代,大语言模型(LLMs)在各种应用中发挥着

分类 学术、 资讯 标签 RAG技术、 事实性错误纠正、 多项选择题、 知识理解训练、 自动化评估工具、 问答任务 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面239 页面240 页面241 … 页面283 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Cursor 中最受欢迎的 5 个 MCP Server!
  • 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
  • “AI购物代理”——电商下一个必争之地
  • 无账号&特殊网络,如何畅跑 Claude Code|附智谱「特别折扣」
  • 文档多模态RAG方案哪个更好?9类Embedding+3类MLLM+4类框架对比及古籍文档数据合成工具

2025 年 12 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
293031  
« 9 月    

归档

  • 2025 年 9 月
  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×