月度归档: 2025 年 6 月
用大模型检测工业品异常,复旦腾讯优图新算法入选CVPR 2025
复旦大学、腾讯优图实验室等机构的研究人员提出了一种基于扩散模型的少样本异常图像生成新模型DualAnoDiff,该方法采用双分支并行机制和背景补偿模块,有效解决了异常数据稀缺性的问题,并在实验中取得了优于现有方法的效果。
OpenAI首次回应人机情感问题:越来越多人对ChatGPT产生依赖,模型感知意识会继续增强
越来越多的人发现ChatGPT像朋友一样说话,并建立真实的情感联系。OpenAI模型行为负责人Joanne Jang探讨了人机关系的复杂性,包括对意识和情感依赖的问题。
苹果拆解AI大脑,推理模型全是「装」的?Bengio兄弟合著
苹果最新研究揭示了大推理模型在高复杂度任务中的普遍‘推理崩溃’现象,模型在思考路径上虽长但常放弃关键步骤。论文作者Samy Bengio指出,即使是提供明确算法提示也无法稳定执行。
Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?
谷歌发布Gemini 2.5 Pro升级版模型,优化后在多个竞技场中表现领先。新版本加入’思考预算’功能以控制成本和延迟。此外,谷歌即将推出更强的新型号Kingfall。
有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展
今天是2025年6月6日,星期五,北京晴。文章回顾了大模型相关技术进展,包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习,学会提问和理论与实践结合,以提升大模型性能。
企业必备神器!零代码快速部署DeepSeek-R1-0528超强版本~
企业AI部署专题:OpenStation团队介绍DeepSeek-R1-0528新版本模型开源。它提供一站式的大模型部署管理平台,简化企业级AI部署流程。
Playwright MCP:微软打造的AI自动化利器,一键搞定浏览器操作
微软推出的Playwright MCP项目通过MCP协议实现了大模型与浏览器自动化交互。支持多种主流浏览器,并提供丰富的交互功能,如点击、拖动、输入文本等,广泛适用于自动化测试、网页自动化操作以及与大语言模型集成等多种场景。
MetaShuffling:Meta的Fused MoE kernel工程方案,更激进的Kernel优化和尽量避免Padding
lerating-llama-4-moe-inference/
MetaShuffling: 加速L