跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

PaperAgent

<200元的o1复现,尽管对比

下午2时 2025/01/20 作者 PaperAgent

我是小冬瓜AIGC,原创超长文知识分享。手撕o1实现课程已帮助多名同学上岸,低成本完成o1类模型复现,环境4×4090训练7天内完成,成本低于200元。课程内容包括实操项目、RL/RLHF、LLM加速等专题,涵盖多种算法和模型训练实践。

分类 分享 标签 200元、 4x4090、 低成本、 小冬瓜AIGC、 小红书、 知乎 1 条评论

JinaAI发布ReaderLM-v2,1.5B轻松拿捏HTML转JSON或MarkDown

下午2时 2025/01/20 作者 PaperAgent

ReaderLM-v2 是一个拥有1.5B参数的语言模型,能够将HTML转换为美观的Markdown或JSON格式,并支持29种语言。它在生成复杂元素、使用预定义模式输出JSON以及处理长文本方面表现出色,并通过强化学习提升稳定性。

分类 分享 标签 1.5B参数、 HTML转换技术、 markdown、 OpenBMB、 ReaderLM-v2、 语言模型 1 条评论

月薪3500的AI程序员Devin一个月试用期都没过~

下午10时 2025/01/19 作者 PaperAgent

Devin 被测试的项目中只有 14% 成功完成,多数任务失败或结果不明。主要问题包括代码错误、难以理解的实现以及对复杂任务的理解不足。开发者主导的工作流程更为有效。

分类 分享 标签 Answer.AI、 DaisyUI、 Devin、 FrankenUI、 多应用部署、 软件工程师 1 条评论

国产 LLM 扎堆开源的一周~

下午2时 2025/01/18 作者 PaperAgent

一周内国产大模型如InternLM3、MiniCPM-o 2.6等相继开源,涵盖多模态、数学推理等领域。阿里云通义千问团队则公布了Qwen2.5-Math-PRM/RM和Qwen2.5-VL两个新模型,展示了在数学推理和多模态处理上的进展。

分类 分享 标签 InternerLM3、 MiniCPM-o、 MiniMax-Text、 Qwen2.5-Math-PRM、 Transformers、 多模态 2 条评论

一篇Agentic RAG全栈技术最新综述

下午10时 2025/01/17 作者 PaperAgent

2025年RAG技术并不会消亡,而是以新的范式
Agentic RAG
得到更广泛、深入应用,202

分类 分享 标签 ADW、 Agentic RAG、 RAG、 图知识库、 智能代理、 检索器库 1 条评论

OpenAI与Anthropic秘密开启了递归自我改进行动~

下午2时 2025/01/17 作者 PaperAgent

OpenAI和Anthropic秘密开启了递归自我改进行动。OpenAI可能开发了GPT-5但选择内部保留;Anthropic的Claude Opus 3.5未发布或用于生成训练数据。专家认为未来O4/O5将能自动化研发。

分类 分享 标签 Anthropic、 Claude-3.6-sonnet、 GPT-5、 o1、 教师模型、 递归自我改进 1 条评论

像人一样学会记忆,谷歌新架构Titans打破Transformer上下文限制

下午10时 2025/01/16 作者 PaperAgent

Google提出Titans架构通过引入长期记忆模块增强模型处理长序列数据的能力,超越现有模型如GPT-4、Llama3.1-70B等,并结合适应性遗忘机制和门控遗忘来管理有限的记忆资源。

分类 分享 标签 Google、 MAC架构、 MAL架构、 Titans、 上下文窗口大小200万、 长期记忆模块 1 条评论

OpenAI Agent已来,Multi-Agent协作是未来

下午10时 2025/01/16 作者 PaperAgent

随着Agentic AI和OpenAI Agent应用的增多,多智能体协作系统(MASs)正朝着多个基于大型语言模型(LLMs)的智能体方向发展。未来的研究将聚焦于如何通过协作机制实现有效、高效的任务解决。

分类 分享 标签 Agentic AI、 Coopetition、 MAS系统、 OpenAI Agent、 多智能体、 竞争合作 发表评论

MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别

下午2时 2025/01/15 作者 PaperAgent

MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。

分类 分享 标签 8B、 GPT-4、 OpenBMB、 未知、 端到端全模态架构、 视觉、语音和多模态流式能力 发表评论

独自一人,怒发顶会!

下午2时 2025/01/15 作者 PaperAgent

越来越多本科生卷科研。缺乏经验导致发文章难。咕泡科技提供一站式科研论文辅导服务,涵盖选题、实验设计等全流程辅导,帮助学员高效发表顶会文章。

分类 分享 标签 500多位专家导师资源、 提高发表成功率、 有导师带着写文章、 知名大厂研究科学家、 计算机各细分领域、 顶会Best Paper提名得主 发表评论
较早文章
较新文章
← 上一页 页面1 … 页面14 页面15 页面16 … 页面21 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • Karpathy最新提出的“系统提示学习”是什么? 未来context为王?
  • 重组敏感时刻,长安汽车为何祭出“百万悬赏令”?
  • 35万月活、年入1.2亿!这款类乙游的AI陪伴火了
  • ICCV 2025万篇投稿破纪录,作者被逼全员审稿!网友痛批不如GPT
  • 17000字Claude 系统提示启示:Karpathy 揭秘LLM 学习缺失“第三范式”

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×