跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

语言模型

Claude 3.7硬控马里奥90秒,GPT-4o开局暴毙!Karpathy直呼基准失效,游戏成LLM新战场

下午4时 2025/03/03 作者 新智元

加州大学圣迭戈分校Hao AI Lab用超级马里奥等游戏评估AI智能体,Claude 3.7表现亮眼。谷歌的Gemini也进行了测试。对比结果显示GPT-4o和GPT-4.5在多种游戏中都明显逊色。

分类 资讯 标签 2048益智游戏、 Claude 3.7、 Hao AI Lab、 实时运行、 语言模型、 超级马里奥 发表评论

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

下午12时 2025/03/02 作者 机器之心

ive Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们

分类 学术、 资讯 标签 90%、 GRPO、 Qwen-2.5-1.5B-Instruct、 强化学习、 微调、 语言模型 发表评论

大模型是否有自知之明?新研究发现LLM可以知晓自己的知识范围

下午4时 2025/03/01 作者 机器之心

识」?对于这个问题,目前还没人能给出非常确切的答案,但近日 Chandar Research Lab

分类 学术、 资讯 标签 不确定性和困惑、 反思、 学习后扩展、 模糊不清回答、 知识范围、 语言模型 发表评论

刚刚,GPT-4.5问世!OpenAI迄今最大、最贵模型,API价格飞涨30倍,不拼推理拼情商

下午12时 2025/02/28 作者 机器之心

开始了直播,奥特曼并没有现身。直播不到 15 分钟就匆匆结束了。
OpenAI 正式发布了其最大、

分类 学术、 资讯 标签 GPT-4.5、 OpenAI、 幽默感、 理解上下文、 生成内容、 语言模型 发表评论

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

下午4时 2025/02/27 作者 新智元

定义CUDA内核,完爆了o1和Claude 3.5 Sonnet,拿下总排名第一。虽然目前只能在不到

分类 资讯 标签 KernelBench、 OpenAI、 内核优化、 少样本调整、 机器学习代码、 语言模型 发表评论

全球首个混合推理模型:Claude 3.7 Sonnet来袭,真实编码力压一切对手

下午4时 2025/02/25 作者 机器之心

不过并不是期待中的 Claude 4.0,而是 3.7 Sonnet 版本。
图源:https://

分类 学术、 资讯 标签 Anthropic、 Claude 3.7 Sonnet、 Claude Code、 代理工作流程、 语言模型、 负责任扩展策略 发表评论

浙大开源的一个专门用于表格数据处理的语言模型:TableGPT2

上午8时 2025/02/25 作者 NLP工程化

浙大开源表格数据处理语言模型TableGPT2,支持不规则表格和模糊查询,提供7B、72B两个版本,已在GitHub上开源。

分类 开源 标签 7B版本、 TableGPT2、 企业级BI、 实际场景、 浙江大学、 语言模型 发表评论

一个基于AI可从任意文本中提取知识图谱的工具:kg-gen

上午8时 2025/02/21 作者 NLP工程化

kg-gen是一款基于AI的工具,可以从任意文本中提取知识图谱,支持长短文本处理及对话消息,具备实体和关系聚类、图谱合并等功能。

分类 开源 标签 FukkenLab、 KGGen工具、 图谱合并、 对话消息、 知识图谱、 语言模型 发表评论

这届出题太难了!新基准让多模态模型集体自闭,GPT-4o都是零分

下午12时 2025/02/18 作者 机器之心

o、Gemini 2 Flash 等等……
但这些大模型,遇到一个名为「ZeroBench」的视觉基

分类 学术、 资讯 标签 ZeroBench、 合成图像、 自然图像、 视觉问题、 语言模型、 难度区分 发表评论

ICLR 2025|如何在ImageNet-1K上训练视觉基础模型?

下午11时 2025/02/13 作者 极市干货

练就可以在多项任务上达到跟别人所提供的预训练模型相当的性能。
>>
加入极市CV技术交流群,走在计算

分类 学术 标签 扩散模型、 极市AI社区、 深度学习、 计算机视觉、 语言模型、 迁移学习 发表评论
较早文章
较新文章
← 上一页 页面1 页面2 页面3 页面4 … 页面6 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • VS Code 1.100 重磅发布:AI 功能全面升级,开发体验大幅提升!
  • Qwen微调干货!对话、指令、Function Call、思考链数据集构造全流程揭秘!
  • 给MCP加上RAG,工具准确率提升200%,起飞~
  • 2025,我们又一次用AI,交了个朋友。
  • 五月组队学习,开设青少年编程课程!

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×