大模型归档 - 第90页共147页

手把手教你本地部署QwQ-32B：轻松吊打DeepSeek-R1蒸馏版！

2025年3月7日14时作者 AI信息Gap

阿里 Qwen（千问）团队发布并开源了一个32B参数的推理模型QwQ-32B，该模型在消费级显卡上可运行，并且性能媲美大模型。部署方法与之前DeepSeek-R1类似。

2025年3月7日12时作者路过银河AI

阿里发布的Manus模型在大模型评测中表现优异，它能自行解决问题，被认为是最佳路线之一，但也被认为具有一定的竞争壁垒较低的特点。

2025年3月7日12时作者路过银河AI

模型，可以图生视频做一部自己的动画片。
基于Flux，叫 Dark Pictures: Cartoo

2025年3月6日16时作者 PaperWeekly

，确保其安全性和对齐性已成为重中之重。
然而，LLMs 仍面临越狱攻击的严峻挑战，现有的越狱攻击方法

2025年3月6日16时作者 PaperWeekly

里的精妙布局，再到医疗档案中的多维数据展示，这些富含视觉元素的文档，不仅仅是简单的文字堆砌，而是融合

2025年3月6日16时作者 PaperWeekly

DeepSeek成为开年AI界明星，一篇论文一天接收顶刊认证。AI辅助写作引发创作革命，未来呈现‘AI辅助+人类主导’模式。顶刊审稿人将分享如何利用DeepSeek辅助论文写作，并介绍相关课程和资源。

2025年3月6日14时作者老刘说NLP

老刘说NLP技术社区旨在以公正客观角度围绕大模型&RAG&文档智能&知识图谱展开多种形式的技术分享，包括每日早报、社区讨论、月度分享等。

2025年3月6日14时作者老刘说NLP

2025年3月6日周四北京晴。文章提到了OLMOCR测试情况及GraphRAG和多模态R1的工作进展，强调了奖励函数设计在强化学习中的重要性，并建议简化复杂系统架构以便应用。

2025年3月6日14时作者 AI技术研习社

Claude 3.7 Sonnet是Anthropic最新推出的AI模型，主打‘会思考’。它在软件工程、推理和数学方面表现更出色，并引入了Extended Thinking功能让思考过程可视化。

2025年3月6日14时作者 AI探索时代

数据预处理是神经网络的重要环节，涉及数据清洗、转换和压缩等步骤，以提升模型性能。