Gemini 2.5 Pro
DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭
编程新王DeepSeek-R1成功晋级,与Gemini 2.5 Pro、Claude Opus 4并列第一。AI领域进展迅速,OpenAI仍占主导地位,谷歌和Meta也有增长机会。
80%到25%逆转!大模型代码能力最新排名:Anthropic不再是唯一的神?
OpenRouter网站发布编程场景下模型使用排行榜。Anthropic的Claude 3.5曾占80%以上份额,后被谷歌Gemini 2.5 Pro以及GPT-4.1抢占市场。最新一代Claude 4帮助份额回升,但仍未回到巅峰水平。
一周1.2k星!兼具质量与效率的OCR模型MonkeyOCR,支持多样化的中英文PDF
MonkeyOCR采用结构-识别-关系(SRR)范式提升文档解析性能,相比MinerU和端到端模型,在九种文档上的表现均有提升。它支持快速开始安装、推理等步骤,并提供了多种示例文档展示效果。
看好了,这才是7家大模型做高考数学题的真实分数
这篇文章描述了作者利用多个推理模型进行了一场数学高考的模拟测试,并详细介绍了测试规则。最终结果显示,Gemini表现最突出,而DeepSeek和Qwen3则表现较弱。通过这次测试,作者认为对于AI模型来说,数学高考并非特别难,但识别错误会影响结果。文章强调了考试公正性和严谨性的重要性。
3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!
近日,Yuliang-Liu团队发布了一款名为MonkeyOCR的轻量级文档解析模型,它以结构-识别-关系(SRR)三元组范式实现了高效精准的文档解析,在英文文档解析任务中超越了Gemini 2.5 Pro和Qwen2.5-VL-72B。其处理速度达每秒0.84页,支持中英文文档处理,并能生成Markdown或JSON结构化数据,适用于企业文档处理、学术研究等场景。
字节发布 SeedEdit 3.0,ChatGPT 企业版大升级,谷歌 Gemini 再进化! AI Weekly 6.2-8
朴实无华!
📢本周AI快讯 | 1分钟速览🚀
1️⃣
🎨 字节跳动发布 SeedEdit 3.0
: