大模型归档 - 第45页共147页

Qwen3技术报告的几点细节、ArXiv论文翻译实现方案及试错历程

2025年5月14日14时作者老刘说NLP

如何做一个arXiv论文翻译的工具？来看看一个研发历程，其中有些方案和坑点可供我们借鉴
。
另一个

随着大模型技术的发展——RAG技术有可能会被淘汰吗？

2025年5月14日14时作者 AI探索时代

关于RAG技术未来是否会淘汰存在不同观点。作者认为不会被淘汰，并将随着大模型技术的迭代不断升级。其优势包括成本低、实时性和领域适配灵活性等。

当英伟达都开始“抱大腿”：Qwen3 凭什么成开源新霸主？

2025年5月14日14时作者 AI信息Gap

Llama 曾经是全球开源大模型的代表。而 Qwen 现在正成为越来越多顶级玩家的标准答案，并且其开源生态正在吸引英伟达、李飞飞团队等众多合作伙伴。Qwen-3 在性能上表现优异，混合推理能力突出，具有自定义思考预算等功能，已成为全球最受欢迎和影响力最大的开源大模型之一。

在我荒芜的土地上，你是最后的玫瑰

2025年5月14日11时作者路过银河AI

今天分享了一个名为Illustrious NoobAI的动漫2.5D风格优秀模型，提供了多种提示词以生成不同场景和角色的艺术作品。

ContextGem文档结构化数据提取框架剖析及UniversalRAG路由多模态检索思路

2025年5月13日19时作者老刘说NLP

检索思路。
另一个是文档信息抽取框架
ContextGem剖析，看看它具体怎么做的，有什么不足，有什

GUI智能体“大脑”升级！浙大&港理工等提出InfiGUI-R1，用强化学习实现深度推理

2025年5月13日16时作者 PaperWeekly

文章介绍了InfiGUI-R1，一个基于Actor2Reasoner框架训练的GUI智能体。该模型旨在提升AI在多步骤操作任务中的能力和可靠性，并能像人类一样先思考后行动。通过推理注入和深思熟虑增强两阶段训练方法，30亿参数的InfiGUI-R1-3B模型在多个基准测试中表现出色。

ICLR 2025 告别Token丢弃：更适合CoT和多轮对话的长文本推理加速方法

2025年5月13日16时作者 PaperWeekly

OmniKV 提出了一种创新性的动态上下文选择方法，用于高效处理长上下文 LLM 推理。它无需丢弃任何 Token，通过动态选择实现计算稀疏，显著提升推理速度和吞吐量，且在各种预算下均优于丢弃 Token 的方法。

腾讯的Cursor–CodeBuddy深度评测-从代码生成到多文件协作生成的AI开发工具评测

2025年5月13日14时作者老刘说NLP

编码智能体Craft通过「需求-拆解-执行-验证」流程实现复杂工程任务，支持从需求到多文件代码生成、重构的全流程自主化开发，并提供MCP生态整合能力及Plan模式辅助用户完成任务。对比Cursor Agent，Craft在多个方面表现出色，支持多文件系统级改造，具备更好的用户体验和计划功能，是开发者值得考虑的选择。

从算法成功转到模型推理：应届生斩获 6 个 offer 的进阶之路

2025年5月13日14时作者老刘说NLP

研究生李在计算机视觉算法岗遇到困难后转向模型压缩与推理加速方向，并参加了杨伟光老师的深度学习模型推理加速项目实践课程，最终顺利拿到企业offer。

即将截止！AI应用产业全景图谱申报倒计时

2025年5月13日14时作者 AI探索时代

2025年AI技术将深入千行百业。北京智合标准中心发布全国首个AI应用产业全景图谱，涵盖基础技术、产业融合等五大层，并提供政策、资本等支持。欢迎更多单位申报，包括案例展示、形象塑造、资源链接及标准编制机会。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31