大模型归档 - 第99页共147页 - 每时AI

【AI职场教程】DeepSeek智能PPT三阶加速法：告别拖延，秒做完炫酷PPT！

2025年2月22日14时作者 AI技术研习社

快速高效地完成专业又有吸引力的PPT，《DeepSeek智能PPT三阶加速法》帮你从结构化输出、视觉暴力转换到演讲者模式，大幅缩短制作时间并提升PPT质量。

真正的 OpenAI？DeepSeek 宣布下周开源 5 大项目！

2025年2月22日14时作者 AI信息Gap

DeepSeek 宣布将开源 5 个项目代码，并强调其小团队与真诚进展，用谦逊和社区力量共创未来。

DeepSeek创始人梁文锋亲自署名的论文长啥样？

2025年2月22日14时作者 AI信息Gap

最近，DeepSeek团队发表的论文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》引起广泛关注。该文由DeepSeek创始人梁文锋亲自署名。NSA（Natively Sparse Attention）通过动态分层稀疏策略、粗粒度token压缩和细粒度token选择，显著提升了长文本处理速度，并在多个任务中超越了传统注意力模型。

穿越时空的唯美画笔：Copax TimeLess

2025年2月22日12时作者路过银河AI

AI绘画大模型——Copax TimeLess XPlus MIX 4！这款模型不仅能让你的画作充满

AAAI 2025 北航团队提出GTG：具备跨城市迁移性的人类移动轨迹生成模型

2025年2月21日23时作者 PaperWeekly

neration Model for Urban Mobility
。本文提出了一种
具备跨城市迁移

GPT还是DeepSeek？不如全都要！南洋理工、IDEA等提出首个多智能体系统LLM Routing框架

2025年2月21日23时作者 PaperWeekly

和 Agent 的局限性。受到人类团队分工协作的启发，将多个 LLM 驱动的智能体组合成一个团队，

大模型推理部署的几个基本认知及prompt压缩策略用于COT推理微调尝试

2025年2月21日14时作者老刘说NLP

2025年02月21日星期x，介绍了大模型推理压缩策略，包括TokenSkip方法用于Controllable Chain-of-Thought（COT），通过分析和剪枝减少冗余token提高推理效率。相关研究文献推荐加入了LoRA微调技术。

【揭秘】AI幻觉：DeepSeek是如何产生幻觉的？如何应对与发挥创造力价值！

2025年2月21日14时作者 AI技术研习社

文章介绍了AI幻觉的概念及其对用户的影响，并探讨了DeepSeek大模型中存在的问题及解决方案。通过技术方案和技术策略的有效应用，可以减少AI幻觉对用户的负面影响，同时发掘其潜在创造力价值。

OpenAI推出的AI基准测试，却让Claude拿了第一名？！

2025年2月21日14时作者 AI信息Gap

OpenAI 推出 SWE-Lancer 基准测试，评估 AI 模型在真实软件工程任务中的表现，涵盖独立开发和管理任务，涉及多种类型和复杂度的软件开发任务。

抛弃OpenAI的Figure，刚刚重磅发布了Helix AI机器人模型！

2025年2月21日14时作者 AI信息Gap

Figure发布最新AI人形机器人模型Helix，具备识别和操作数千种家用物品的能力，并能执行复杂任务，如整理冰箱、与另一台机器人协作完成家务等。