2025年2月25日14时 - 第7页共12页

DeepSeek-R1大模型：如何快速搭建Web聊天机器人？

2025年2月25日14时作者小兵的AI视界

still-Qwen-7B
作为一款高性能的蒸馏模型，不仅继承了大模型的强大推理能力，还通过优化大幅

用DeepSeek+飞书多维表格，3分钟批量生成100篇爆款文章！

2025年2月25日14时作者 AI技术研习社

用飞书多维表格和DeepSeek R1快速批量生成高质量爆款文章，实现选题、内容生成及多平台分发自动化。

《超大规模操作手册：在 GPU 集群上训练》Part3(寻找最佳的GPU优化配置)

2025年2月25日14时作者 GiantPandaCV

在模型大小和Batch Size确定后，通过实验逐步调整并行技术组合以优化训练吞吐量。讨论了不同配置下的内存、通信瓶颈以及节点数量增加对效率的影响，并强调了实际实验设计中的挑战与教训。

怎么实现一个神经网络？神经网络的组成结构

2025年2月25日14时作者 AI探索时代

设计和训练神经网络模型通常涉及数据准备、模型设计、模型训练和模型测试验证四个步骤。

Anthropic 推全球首个混合推理模型Claude 3.7，编程能力大幅增强

2025年2月25日14时作者 AI先锋官

Anthropic发布了新款Claude 3.7和Claude Code，Claude 3.7是首个混合推理模型，可在不同模型间选择答案，并展示思考过程。它在多个基准测试中表现优异，在SWE-bench Verified 和 TAU-bench 中表现出色，在零售和航空场景下的表现也优于其他模型。Anthropic还推出了代理编码工具Claude Code，能帮助用户完成代码任务。

用DeepSeek一键对喷，这个软件竟能“吵架包赢”？丨测评

2025年2月25日14时作者 AI新榜

上电竞老炮的毒舌，这场跨服对喷注定是场不对称战争，直到我发现了这款能施展DeepSeek毒舌功底的A

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28