太震撼了!梁文锋携DeepSeek团队丢出注意力新机制重磅论文,网友:这才是真正的OpenAI

DeepSeek发布原生稀疏注意力(NSA)技术,旨在提升大语言模型处理长文本的能力和效率。NSA通过动态分层稀疏策略结合粗粒度的Token压缩和细粒度的选择优化,实现了高效长文本建模,实验结果显示NSA在多个任务中超越了Full Attention模型,并显著提升了计算速度。

杭州再出王炸! 揭秘 WiseDiag-Z1:全球领先医疗大模型背后的技术突破

杭州智诊科技的WiseDiag-Z1全科医学大模型发布会让医疗诊断变得更简单。它拥有730亿参数的强大知识底座,并能进行深度推理,提供专家级建议。亮点功能包括医学专家分身、秒懂复杂医学报告和API开放平台,助力医疗AI生态建设。

太猛了!英伟达让 Deepseek R1 编写 GPU 内核,结果 R1 写的比熟练工程师还好

英伟达使用DeepSeek-R1模型加上推理时序scaling技术,让AI自动生成GPU内核代码,并在KernelBench Level 1上实现100%数值正确性。这是对AI推理能力的突破,未来可应用于自动优化底层代码,加速AI技术发展。

巴黎AI峰会集锦!奥特曼大放厥词:5000亿星际之门在随后的5万亿AI集群面前不算什么

欧盟委员会主席冯德莱恩宣布投资2000亿欧元推动欧洲人工智能发展,包括建设新基金支持200亿欧元的投资。李飞飞认为AI可能带来文明级影响,并强调基于科学而非科幻进行治理的重要性。