量子位
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
DeepSeek-v3在Aider多语言编程测试排行榜中超越Claude 3.5 Sonnet至第一,同时被评为当前最强开源LLM。模型参数提升显著,结构变化包括使用sigmoid作为门控函数、引入新的Top-k选择方法和调整专家评分等。
钛动科技陈德品:Scaling Law在营销应用中也适用,AIGC内容正在催生爆款 MEET2025
营销应用赛道也有Scaling Law。通过效率提升可以提高爆款发现概率。Tec Creative产品集成通用模型原子能力与场景Know how,快速生成高ROI素材。未来将打造智能剪辑工具和Agent系统,提升交互效率。
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型
研究发现,题目中网格规模越大,大模型的表现越差。ML工程师米哥对ARC数据集进行观察后发现,o3、o1和Claude等模型的性能下降与网格数量有关,提示大模型在应对大规模网格问题时可能存在问题。
英伟达年终核弹!全新B300为o1推理大模型打造,RTX5090也曝光了
英伟达发布B300系列AI芯片,算力提高50%,显存从192GB提升到288GB。包含72块GB300的‘新一代计算单元’被评价为OpenAI推理模型唯一可行方案。
你的下一个浏览器,可以是豆包电脑版!
豆包电脑版通过AI技术提升了视频、写作、图像生成及办公等功能体验,支持即时总结、脑图呈现、搜索辅助等,使用户能在浏览器、写作、作画、学习与办公等多种场景中更高效地完成任务。
声网刘斌:“Her”真正落地实现离不开RTE能力的支撑|MEET 2025
声网首席运营官刘斌在MEET 2025智能未来大会分享了RTE(Real Time Engagement)技术在AI Agent时代的全新价值,强调了多模态对话应用的关键因素包括低延迟和打断功能。他指出,大模型时代下,RTC技术对于实现高质量实时互动至关重要。