PaperAgent
DeepSeek与Qwen组团开源了模型,冲!
阿里通义千问和DeepSeek分别开源了Qwen2.5-VL-32B-Instruct和DeepSeek-V3-0324两个模型,前者主要提升了数学推理、细粒度图像理解与推理能力,并且调整输出样式以提供更符合人类偏好的答案;后者则强调编程能力和前端开发功能。
0.35秒OCR整页文档,比Qwen2.5 VL高出10%的文档转换多模态模型!
SmolDocling 是一种高效文档转换的多模态图文到文本模型,由IBM Research联合推出,在A100 GPU上每页仅需0.35秒完成处理,并使用256M参数比Qwen2.5 VL更高效。其功能特性包括高效的文档表示、光学字符识别、布局和定位保留、代码识别、公式识别、图表识别及表格识别等。
被放养的博士能靠自己毕业嘛?
写论文对于很多人来说是一大挑战。沃恩智慧作为21年老牌辅导机构提供一站式科研服务,包括选题、调研、实验、润色和投稿等,并与QS前50名导师合作,为学员提供保姆级SCI写作课程及申研申博攻略。
超越o1&QwQ-32B,中科院SolutionRAG大幅提升复杂工程方案设计能力
中科院&通义实验室提出并开源了基于树状探索和双点思维的系统SolutionRAG,用于评估多约束复杂工程问题上的解决方案生成能力。该系统在SolutionBench上取得了最先进的性能,并显著优于现有方法,有望提升实际应用中的工程方案设计自动化和可靠性。
R1圈的新王者,腾讯混元-T1发布,首个混合Mamba推理模型~
腾讯发布混元-T1深度思考模型,在长文捕捉、优化长序列处理及强化学习训练等方面取得突破,已在公开benchmark和内部人工体验集上表现出色。
Manus 引爆 AI 热潮,你的技术知识已 “过期”?
最近朋友圈被 Manus 刷爆,它能快速生成电影级 CG、训练数字人、筛选简历及24小时带货等。但技术突破引发焦虑,开发者感叹转型困难。为此,DeepSeek 推出系列课程帮助从零开始学习 AI 大模型,涵盖新手装备站和实战经验等内容。