DeepSeek V3“小版本更新”背后,V3和R1正在融合成一个模型
DeepSeek发布V3-0324版本升级,强调推理能力、前端开发能力、中文写作能力和搜索能力提升。此次更新注重实用性和用户需求,特别是代码生成和前端视觉设计能力显著增强,模型免费使用且参数较小。
DeepSeek发布V3-0324版本升级,强调推理能力、前端开发能力、中文写作能力和搜索能力提升。此次更新注重实用性和用户需求,特别是代码生成和前端视觉设计能力显著增强,模型免费使用且参数较小。
多模态思维链(MCoT)系统综述发布,介绍了其基本概念、分类法和应用场景,并探讨了当前挑战及未来研究方向。通过推理构建视角、结构化推理视角等六大技术支柱提升模型能力,改变机器人的操作、自动驾驶的安全性、医疗诊断的速度与准确性以及教育的个性化教学等方面。论文链接:https://arxiv.org/pdf/2503.12605
MLNLP社区是国内外知名的人工智能社区,致力于促进机器学习与自然语言处理领域的学术交流和技术进步。近期发布了有关LLM如何通过自我学习和工具调用提升推理能力的论文。START模型能自动调用Python等外部工具解决复杂问题,未来AI或将随身携带各种工具箱。
夸克发布了AI超级框功能,可以直接调用阿里完善的工具基建完成任务。它在健康、影视、学术领域提供了专业的内容搜索,并支持 AI 编程和 PPT 设计等功能。同时拥有强大的模型生态,涵盖多模态信息处理与深度推理能力。
马斯克在社交平台X上宣布Grok 3——地球上最聪明的人工智能模型发布,声称其推理能力超越ChatGPT和DeepSeek。DeepSeek面临挑战,需加快技术追赶步伐。文章还介绍了DeepSeek的突破性成果原生稀疏注意力,并指出AI竞争远未结束。
马斯克发布Grok 3,这款新版本采用最佳预训练模型并继续使用强化学习进行训练。它在LMSYS盲测中排名首位,并且在超级订阅计划下提供额外的推理和DeepSearch查询功能。Grok 3还包含了一个被称为下一代搜索引擎的DeepSearch产品。
Perplexity 宣布推出免费的 Deep Research 功能,相比 OpenAI 和谷歌的产品,其优势在于搜索深度和广度、推理能力和输出形式。
新智元报道
编辑:犀牛 好困
GameArena团队开发的《AI Space Escape》游戏通过紧张刺激的密室逃脱方式评估AI模型的推理能力,生成宝贵的游戏数据,并将所有数据公开供进一步研究。该游戏超越了传统的数学和编程基准测试方法。
Ilya Sutskever 创立的公司 Safe Superintelligence Inc. 将冲刺 200 亿美元估值,该公司以实现安全的超级智能为唯一目标,并在去年获得10亿美元融资。