跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

24小时,一块GPU,就能训练出顶级语音模型

2025年2月27日16时 作者 NLP工程化

本文提出了Slam训练秘诀,在单张GPU和24小时资源限制下高效训练高质量语音语言模型,显著提升AI研究效率。

分类 开源 标签 SLAM、 创新、 合成数据、 计算资源、 语音语言模型、 高效训练 发表评论

即将发布 QwQ-Max 的正式版本

2025年2月27日16时 作者 NLP工程化

Qwen发布了QwQ-Max-Preview模型,该模型基于Qwen2.5-Max推理模型,具有更强的数学理解、编码和代理能力。即将发布QwQ-Max正式版,并在Apache 2.0下开放源代码。

分类 开源 标签 Max、 Qwen2.5、 QwQ-Max-Preview、 创造力、 数学理解、 编码 发表评论

阿里万相大模型宣布开源

2025年2月27日16时 作者 NLP工程化

阿里万相支持消费级GPU生成视频,能生成中英文文本,并开源。

分类 开源 标签 8.19 GB VRAM、 图像生成、 开源技术、 自然语言处理、 阿里云、 阿里巴巴 发表评论

Claude 3.7 Sonnet信息卡:Claude 3.7 Sonnet 是一款混合推理模型

2025年2月27日16时 作者 NLP工程化

Claude 3.7 Sonnet 是一款混合推理模型,重点在于减少潜在伤害,通过训练和周边安全系统进行评估。

分类 开源 标签 BIOSS评估、 Claude 3.7 Sonnet、 儿童安全、 减少潜在伤害、 网络安全评估、 自主性评估 发表评论

电子书 Algorithms for Optimization,一本关于优化算法的教材

2025年2月26日8时 作者 NLP工程化

本书介绍了多种优化方法及其在工程设计、数学和计算机科学等多个领域的应用,涵盖基础到高级的内容。

分类 开源 标签 Mykel J. Kocher、 优化方法、 基础到高级、 多领域适用、 斯坦福航空航天学的副教授、 涵盖多种 发表评论

MLGym:推进人工智能研究Agent的新框架和基准

2025年2月26日8时 作者 NLP工程化

本文提出MLGym框架和基准,评估前沿LLM在AI研究任务上的表现,并强调构建和完善评估体系的重要性。

分类 开源 标签 AI研究agent、 MLGym、 前沿语言模型、 原创性科学研究、 开放式任务基准、 评估体系 发表评论

2025 LLM 入门+进阶路线图 by Sebastian Raschka

2025年2月26日8时 作者 NLP工程化

为2025年及以后的LLM技术应用提供循序渐进路线图,强调基础理论理解、效率提升和全局性考虑。

分类 开源 标签 2025年、 Raschka、 代码训练、 伦理、 全局性考虑、 生产工具 发表评论

FlashMLA,这是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核

2025年2月26日8时 作者 NLP工程化

FlashMLA是DeepSeek专为英伟达Hopper GPU打造的高效MLA解码内核,已在多个配置下实现高吞吐量和峰值性能。

分类 开源 标签 3000GB/s、 580 TFLOPS、 CUDA 12.6、 DeepSeek、 FlashMLA、 Hopper GPU 发表评论

Zotero-arxiv-workflow:为Zotero用户管理arXiv论文提供高效解决方案

2025年2月26日8时 作者 NLP工程化

Zotero-arxiv-workflow:为用户自动合并arXiv预印本和期刊发表版本,一键更新最新信息和PDF。

分类 开源 标签 arXiv论文、 GitHub、 Zotero-arxiv-workflow、 开源贡献、 用户管理、 自动合并 发表评论

HeadInfer:通过逐头卸载实现内存高效的大语言模型推理

2025年2月26日8时 作者 NLP工程化

HeadInfer 是一个内存高效的推理框架,专为大型语言模型设计,通过逐头卸载策略减少 GPU 内存消耗。

分类 开源 标签 8B 模型、 内存优化的推理框架(HeadInfer)、 显著减少 GPU 内存消耗、 未提及、 百万级别 token 推理 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面60 页面61 页面62 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 刚刚,Claude 4.1 发布
  • 文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!
  • 终于!OpenAI 开源了2款模型:gpt-oss-120b 和 gpt-oss-20b
  • 刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗
  • OpenAI首席科学家访谈被紧急制止!有些名字现在不让说了……

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×