日期: 2025 年 2 月 18 日
百度搜索×DeepSeek!官宣接入仅24小时全量上线满血版,实测来了
百度搜索正式全量接入DeepSeek-R1满血版,实现用户与AI深度融合。通过百度APP直接搜索“AI+”,即可访问新功能。实测显示,百度搜索的DeepSeek-R1能准确回答各种问题,包括文化背景分析、日常生活答疑等场景。
DeepSeek迎最强队友!国产大模型开源猛踩油门,全球第一,免费可用,技术报告公开
阶跃星辰与吉利联合开源两款Step系列多模态大模型:全球参数量最大的文生视频大模型Step-Video-T2和语音交互模型Step-Audio。这两款模型已在跃问APP内开放体验,支持中英文提示,并公布了详细的报告和技术方案。
鹅厂All in DeepSeek!超14款产品组团接入满血版R1,市值狂飙3000亿
腾讯旗下多款产品接入满血版DeepSeek R1,微信AI搜索等应用引爆热搜。腾讯股价大涨3000亿,百度也积极跟进相关技术。
月之暗面Kimi暂缓“烧钱”投放,知情人称现在App用户是自然增长|
月之暗面Kimi因DeepSeek热潮暂缓‘烧钱’投放。近期大模型六小虎中有五家公司减少或暂停广告投放。月之暗面对推广动作进行相应调整,并推出新模型Kimi Latest,聚焦长文本输入与上下文长度控制。
太震撼了!梁文锋携DeepSeek团队丢出注意力新机制重磅论文,网友:这才是真正的OpenAI
DeepSeek发布原生稀疏注意力(NSA)技术,旨在提升大语言模型处理长文本的能力和效率。NSA通过动态分层稀疏策略结合粗粒度的Token压缩和细粒度的选择优化,实现了高效长文本建模,实验结果显示NSA在多个任务中超越了Full Attention模型,并显著提升了计算速度。
SimDINO 借助编码比率正则化简化DINO并提升性能
本文介绍了一种简化DINO和DINOv2训练流程的方法,通过编码率正则化提升模型性能。该方法提出SimDINO和SimDINOv2模型,减少了复杂的调整步骤和超参数设置,实验结果表明新模型在多种下游任务中性能优于原版模型,并且对不同设计选择表现出更强的鲁棒性。