跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Arxiv.org

基于能量的Transformer横空出世!全面超越主流模型35%

2025年7月8日16时 作者 量子位

弗吉尼亚大学团队提出EBT架构,通过能量机制在跨模态和多维度上超越了Transformer++模型,并展示了其在推理、数据量、参数量等多方面的优势。

分类 资讯 标签 Alexi Gladstone、 Arxiv.org、 EBT、 Energy-Based Transformers、 Transformer++、 伊利诺伊大学厄本那-香槟分校 发表评论

Google新研究:降低大模型幻觉的全新视角——充分上下文!

2025年6月17日16时 作者 AI工程化

谷歌研究人员提出’充分上下文’概念,通过自动评估器区分充分与不充分上下文来提升LLM准确性和可靠性,提出选择性生成框架优化RAG系统性能。

分类 分享 标签 Arxiv.org、 Cyrus Rashtchian、 代表数据、 增强生成、 模型拒绝回答、 错误答案 发表评论

再见AI Agents,你好Agentic AI!

2025年5月27日14时 作者 Datawhale

Agentic AI 是一种基于多个 AI 代理协作实现复杂目标的系统,旨在克服传统 AI Agents 在处理复杂任务时的局限性。

分类 分享 标签 2025、 Agentic AI、 Arxiv.org、 Qiaoqiao Li、 Wei Chen、 Yan Liu 发表评论

多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合

2025年3月12日16时 作者 量子位

上海交大团队通过实验发现多模态数据对语言质量的影响有限,提出OmniAlign-V数据构建Pipeline,包含高质量的多模态数据,并在多个基准测试中验证了其有效性。

分类 资讯 标签 Arxiv.org、 GPT-4o、 OmniAlign-V、 上海交大、 多模态对齐、 预训练知识 发表评论

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

2025年1月6日14时 作者 机器学习算法与自然语言处理

MLNLP 社区致力于促进 NLP 学术界、产业界及爱好者间的交流合作,Meta 新研究展示了记忆层在预训练语言模型扩展中的实用性和性能提升。

分类 学术 标签 Arxiv.org、 Meta、 提升性能、 稀疏激活、 记忆层、 语言模型 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • CU-Multi:助力多机器人地图融合与位置识别的高质量数据集
  • Observer:本地开源微Agent,守护隐私的同时观察、记录并响应屏幕动态
  • tmux-mcp:让AI助手轻松掌控tmux终端会话的Model Context Protocol
  • gpt-load:一个高性能的OpenAI格式API多密钥轮询代理服务器
  • 谁将主导AI下半场?全国首部私有化部署标准公开征集中

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×