PaperAgent

增强RAG系统落地效果的9条最佳实践

2025年1月29日22时作者 PaperAgent

通过系统研究RAG系统的多个关键因素，包括语言模型大小、提示设计、文档块大小等，得出了9条最佳实践，并提出了一系列实验设计以评估RAG系统的性能，涵盖TruthfulQA和MMLU数据集。

分类分享标签 192个token、 45B参数模型、 HelpV2提示、 RAG系统、 TruthfulQA、对比式上下文学习发表评论

DeepSeek又开源Janus-Pro，7B多模态强势登顶，OpenAI彻底慌了

2025年1月28日14时作者 PaperAgent

DeepSeek开源新一代统一多模态模型Janus-Pro，包含两个尺寸：Janus-Pro-1B和Janus-Pro-7B。该模型在多模态理解和生成方面超越了Meta、Google等知名机构的模型，并改进了训练策略、扩展数据集和扩大模型规模。

分类分享标签 DeepSeek、 Janus-Pro、 Meta、合成美学、图像字幕、统一多模态模型发表评论

组团开源，Qwen2.5-VL转角遇见DeepSeek Janus-Pro！

2025年1月28日14时作者 PaperAgent

今天除夕，阿里千问开源了Qwen2.5-VL模型，包含3B、7B和72B三个尺寸，并具有感知丰富世界、作为视觉Agent、理解长视频和捕捉事件、精准的视觉定位及结构化输出等新特性。

分类分享标签 72B、 Qwen、多模态模型、视觉理解和操作、阿里千问、预训练语言模型发表评论

阿里Qwen2.5-1M开源，仅320G可推理14B百万token

2025年1月27日14时作者 PaperAgent

阿里千问开源了Qwen 2.5-1M模型及其对应的推理框架，支持百万Token上下文处理，并分享了训练和推理框架的设计细节及消融实验结果。

分类分享标签 1M长度、 Qwen、上下文长度、消融实验、稀疏注意力、阿里云发表评论

成功率97.8%！中科院PPTAgent模拟人类制作流程，高质量PPT轻松搞定

2025年1月27日14时作者 PaperAgent

中科院提出PPTAgent，一种基于编辑的两阶段PPT生成框架，它通过分析和生成高质量PPT，显著提高了文本、设计和连贯性的评估评分，并在多个领域表现出色。

分类分享标签 PPTAgent、两阶段框架、中国科学院、中科院研究人员、内容设计连贯性、显著提升发表评论

微软：100款 GenAI 产品安全测试背后的 8 条教训与 5 个案例总结！

2025年1月26日14时作者 PaperAgent

微软对100多款生成式AI产品进行了红队测试，并分享了八个主要教训和五个案例研究，以指导实际的AI安全测试，包括识别风险、评估大模型聊天机器人的应对能力等。

分类分享标签 GenAI、微软、案例研究、红队测试、缓解措施、风险识别发表评论

首个DeepSeek-R1全开源复现Open-R1来了

2025年1月26日14时作者 PaperAgent

Open-R1是一个完全开源的DeepSeek-R1复现项目，包含训练、评估和生成合成数据脚本，目标帮助用户复现并在此基础上进行开发。

分类分享标签 DeepSeek-R1、 Hugging Face、 Open-R1、复杂命令配置、强化学习、模型复现发表评论

OpenAI的Operator一测一个不吱声~

2025年1月25日22时作者 PaperAgent

OpenAI发布首个智能体Operator后，Every CEO和联创Dan进行了实测，仅成功完成2项任务。结论包括浏览限制、任务范围有限及提示的重要性。Operator在购票、房屋清洁等具体任务上表现出色，但在复杂分析或需要深入了解的任务中表现不佳。

分类分享标签 Dan、 Every、 OpenAI、 Operator、 Spotify Wrapped、测试任务发表评论

R1风起，清华、港科大发布大模型强化推理技术最新全面综述

2025年1月25日22时作者 PaperAgent

本文回顾了大型语言模型在推理能力方面的最新进展，从SFT到RLHF，再到ORM和PRM等技术的演变，讨论了测试时扩展的重要性，并介绍了各种增强LLMs推理能力的技术方法。

分类分享标签 Memory-based Reinforcement、强化学习、推理能力、监督式微调、自回归token生成、语言模型 1 条评论

OpenAI智能体Operator背后CUA技术解析

2025年1月24日14时作者 PaperAgent

智谱、ByteDance和清华大学发布GLM-PC等智能体后，OpenAI发布了首个AGI L3级智能体Operator，可以执行网络任务并交互网页。Operator结合了GPT-4的视觉能力和强化学习推理能力。构建开源Computer-Using Agent的技术挑战包括安全隔离、精确点击、视觉理解和部署LLM等。

分类分享标签 AGI、 LLM、 OpenAI、 Operator、强化学习、视觉能力 1 条评论

较早文章

较新文章

← 上一页页面1 … 页面22 页面23 页面24 … 页面30 下一页 →

2025 年 10 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31