月度归档: 2025 年 3 月
通义开源32B视觉模型,阿里与DeepSeek前后脚上新!能看图说话
新模型Qwen2.5-VL-32B-Instruct在视觉理解和数学推理方面表现出色,并且其纯文本能力优于GPT-4o mini。该模型已在GitHub和Hugging Face上开源,可用于多种场景,包括对图片的理解、解决复杂的数学问题等。
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
本文介绍了当前科研人员青睐的AI模型:o3-mini、DeepSeek-R1、Llama、Claude 3.5 Sonnet和Olmo 2。它们各有优劣,但为科研人员提供了多样选择。
突发!DeepSeek开源新版V3,再次震惊国外
DeepSeek发布V3-0324模型,代码能力媲美闭源最强模型Claude 3.7。该模型速度快、免费且开源,采用创新策略平衡专家负载和路由机制,性能表现优异。
超出想象!DeepSeek V3小更新:实测强到离谱,胜过R1,毫不逊色Claude 3.7
Sam Altman 推出的 DeepSeek v3 版本在编程能力和前端表现方面超越了 Claude 3.7,并且没有做任何宣传就上传至 Hugging Face。实测显示,DeepSeek v3 在多个任务上的表现都非常出色,包括赛朋克风格的贪吃蛇游戏和天气卡片生成任务。
5 个用于智能体记忆的框架,100% 开源
5个开源框架用于智能体记忆:Graphiti构建时间感知的知识图谱;Letta提供透明且长期记忆状态的智能体;Mem0结合LLM和向量存储技术主动学习适应变化;Memary赋予AI类似人类的记忆能力;Cognee将知识图谱与RAG结合维护动态知识图谱。