跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

NLP工程化

探索LLM如何捕捉和表征领域特定知识

2025年4月30日8时 作者 NLP工程化

本文揭示了大型语言模型在预填充阶段的隐藏状态中内在地编码了领域特定知识,并提出了一种利用这些轨迹进行查询路由的模型选择策略,显著提高了性能特别是开放式生成任务的表现。

分类 开源 标签 LLM、 提高性能、 查询路由策略、 潜在领域相关轨迹、 隐藏状态、 领域微调 发表评论

一份关于Gemini预训练的精彩PPT

2025年4月30日8时 作者 NLP工程化

DeepMind专家Vlad Feinberg在普林斯顿的演讲中讨论了模型规模扩展法则的历史、优化策略及未来研究方向,强调小模型客户需求、推理感知扩展法则,并建议开发硬件专用内核和改进量化技术。

分类 开源 标签 DeepMind、 Flash Attention技术、 Funsearch、 Inference-Aware Scaling Laws、 Vlad Feinberg、 普林斯顿大学 发表评论

微软上架了免费的生成式AI入门课程——Generative AI for Beginners

2025年4月30日8时 作者 NLP工程化

微软推出免费生成式AI入门课程,涵盖基础原理到实战项目全流程,支持Python和TypeScript编程语言,还提供后续对接服务、官方社群交流等资源。

分类 开源 标签 Microsoft、 免费、 初学者、 开源、 微软公司、 生成式AI入门课程 发表评论

长达256页的构建AI智能体深度报告

2025年4月30日8时 作者 NLP工程化

蒙特利尔大学研究者发表的报告全面梳理了智能体技术,涵盖构成要素、推理、行动系统以及自我进化等内容,详细介绍了AI智能体的内部机制和工作原理。

分类 开源 标签 liu、 优化器、 感知-思考-行动循环、 智能体技术报告、 自我进化、 蒙特利尔大学 发表评论

自回归模型的新突破:首次生成2048×2048分辨率图像

2025年4月29日8时 作者 NLP工程化

研究人员提出TokenShuffle方法显著减少多模态大语言模型中的视觉token数量,提高效率并促进高质量图像生成,超越同类自回归和强扩散模型。

分类 开源 标签 AI模型技术、 Meta、 TokenShuffle、 新加坡国立大学、 显著提高效率、 西北大学 发表评论

PipelineRL:大规模异步强化学习框架

2025年4月29日8时 作者 NLP工程化

PipelineRL是用于大规模异步强化学习的框架,支持多GPU异步训练、实时权重更新和Redis流式数据传输,提高硬件利用率和分布式训练效率。

分类 开源 标签 PipelineRL团队、 Redis流式数据传输、 ServiceNow、 多GPU异步训练、 实时权重更新、 强化学习框架 发表评论

把 DeepSeek-V3-0324 变成推理模型

2025年4月29日8时 作者 NLP工程化

基于DeepSeek-R1微调的DeepSeek-R1T-Chimera模型在保持性能的同时显著缩短了思考时间,可作为DeepSeek-R1的加强版使用。

分类 开源 标签 DeepSeek-R1、 DeepSeek-R1T-Chimera、 DeepSeek-V3-0324、 优化、 微调、 思考时间显著变短 发表评论

Gemini Coder 开源

2025年4月29日8时 作者 NLP工程化

通过VSCode插件使用Gemini-2.5-Pro和Gemini-2.5-Flash实现免费代码写作功能。

分类 开源 标签 Gemini-2.5-Pro、 Google AI Studio、 robertpiosik、 VSCode、 免费使用、 高级技术 发表评论

MLX-Audio发布了v0.1.0 版本

2025年4月28日8时 作者 NLP工程化

MLX-Audio发布支持Dia模型的v0.1.0版本,针对MacOS设计的推理引擎MLX已支持前日爆火的语音生成模型Dia。

分类 开源 标签 Dia模型、 MacOS、 MLX-Audio、 v0.1.0版本、 大模型、 语音生成模型 发表评论

drawDB:数据库实体关系(DBER)编辑器

2025年4月28日8时 作者 NLP工程化

数据库实体关系(DBER)编辑器——drawDB支持可视化编辑库表结构与关系,并可导入现有库表进行梳理,同时具备AI生成SQL功能,部署方便,基于网页应用。

分类 开源 标签 AI生成SQL、 DrawDB、 GitHub、 微信、 数据库实体关系、 知识星球 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面37 页面38 页面39 … 页面92 下一页 →

AGI AI AI技术 Anthropic ChatGPT Claude Cursor DeepSeek DeepSeek-R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 藏师傅教你做即将爆火的AI玄学祈福壁纸,不止提示词还有创作思路
  • 爆火的Lovable:AI建站工具,8个月达到1亿美元ARR,速度之快超过了Cursor
  • 深度 | 安永高轶峰:AI浪潮中,安全是新的护城河
  • 揭秘:OpenAI是如何发展出推理模型的?
  • 获奖 AI 听力应用推出个性化音频调节功能

2025 年 8 月
一 二 三 四 五 六 日
 123
45678910
11121314151617
18192021222324
25262728293031
« 7 月    

归档

  • 2025 年 8 月
  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×