大模型归档 - 第56页共147页

腾讯低调开源「作业终结者」：3B参数实现多模态SOTA，数学物理全通吃

2025年4月25日16时作者 PaperWeekly

腾讯开源了一个只有3.78B参数的多模态模型VLR1-3B，对比同级别模型表现优异。它在数学、物理和视觉场景中均表现出色，并能提供推理能力。

金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法

2025年4月25日14时作者老刘说NLP

今天是2025年4月25日，星期五，北京晴。文章讨论了多模态模型如何将文档图片转为markdown和docx的逻辑，并介绍了Qwen2VL、internvl、GOT-OCR及docling等模型的具体使用方式。此外，还探讨了金融领域推理模型进展，特别关注DianJin-R1的工作，强调数据质量和强化学习在提升模型性能中的重要性。

Deep Seek爆款选品逻辑揭秘：数据驱动的智能爆品制造机

2025年4月25日14时作者 AI技术研习社

Deep Seek是一款基于AI的应用决策系统，通过解析非结构化信息和生成语义标签，为电商选品提供精准的数据支持。它能揭示用户需求并识别市场空白点，从而提高爆品的成功率。

ChatGPT 模型限额翻倍，你的 Plus 会员正在悄悄升值！

2025年4月25日14时作者 AI信息Gap

OpenAI 将 ChatGPT 中两个顶级模型 o3 和 o4-mini-high 的使用额度从每周 50 次和每天 50 次提升至每周 100 次和每天 100 次。此外，ChatGPT Plus 用户的 Deep Research 使用额度也有所增加。

3秒克隆真实声音：cosyvoice2

2025年4月25日11时作者路过银河AI

文章介绍了使用AI克隆音频的过程和遇到的问题，并分享了关于《莎士比亚全集》的阅读经历。最后提及了一些重要的书信资料及捐赠活动。

一张图片找出你在哪？o3-like 7B模型玩网络迷踪超越一流开闭源模型！

2025年4月24日23时作者 PaperWeekly

ld
Huggingface 模型：
https://huggingface.co/TheEight

CVPR 2025 HD-EPIC定义第一人称视觉新标准：多模态标注精度碾压现有基准

2025年4月24日23时作者 PaperWeekly

能与虚拟现实等前沿领域的重要突破口。它要求模型不仅能识别物体，还要理解人类如何操作这些物体、为何操作

DeepSeek-R1-Zero被“轻松复现”？10%训练步数实现数学代码双领域对齐

2025年4月24日23时作者 PaperWeekly

通过SRPO方案，快手Kwaipilot团队在处理数学与代码混合数据时实现了效率和效果的双赢。SRPO结合了两阶段训练范式和历史重采样技术，仅用10%的训练步数，在AIME24和LiveCodeBench基准测试中超越了现有模型的表现。

RAG与Reasoning结合的必要性、实现范式及Agents、RAG产品、大模型安全新总结

2025年4月24日14时作者老刘说NLP

2025年4月24日北京晴。文章探讨了检索增强生成（RAG）与推理（Reasoning）结合的必要性及实现范式，并总结了Agents、RAG产品及大模型安全的相关研究。

15人小团队，两个月从70万干到2000万美金，这个AI项目做对了什么？

2025年4月24日14时作者 AI信息Gap

Bolt.new 创始人 Eric Simons 在播客中分享了自家产品的背后故事，一个从 Stackblitz 起家、历经转型最终成功的故事。产品通过自然语言生成完整 Web 应用来服务产品经理、设计师和创业者等非技术人群，并积累了独特的底层技术 ‘WebContainer’。团队在短短数月内实现了数千万美金的年收入增长。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31