全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四 2025年7月11日16时 作者 新智元 SciArena是首个专为科学文献任务量身定制的大模型评估平台,通过用户投票和分析来测试大语言模型的科研能力。
DeepSeek R1 + Agent 的下半场 2025年2月9日19时 作者 PaperAgent DeepSeek R1凭借其低成本和技术创新,在市场上迅速获得了关注,特别是在Chatbot市场。尽管短期内对ToB和开发者影响有限,但未来发展方向可能走向Agent系统,并且OpenAI已经开始布局这一趋势。