深度学习模型归档 - 第2页共3页

爆料！DeepSeek R2即将发布：1.2万亿参数，成本暴跌97%，真王炸，还是空欢喜？

2025年4月28日14时作者 AI信息Gap

DeepSeek 新模型引发热议，混合专家模型 DeepSeek-R2 集齐 1.2 万亿参数和 780 亿动态激活参数，成本比 GPT-4 低97.3%，引发广泛关注。

o3猜照片位置深度思考6分48秒全程高能，范围精确到“这么近那么美”

2025年4月27日16时作者量子位

ChatGPT通过分析照片中的车牌和细节，准确猜出地理位置，从加州锁定具体小镇。作者分享了详细对话记录及思考过程，指出模型对视觉信息的解析能力有待提升。

免费用户狂喜！ChatGPT深度研究轻量版开放，实测+对比+白嫖教程全在这！

2025年4月26日14时作者 AI信息Gap

OpenAI 推出轻量版深度研究功能，允许所有用户（包括免费用户）使用该功能。轻量版基于 o4-mini 模型，回复较短但效果几乎与满血版一致。

文科已死，计算机科学将亡？ACM警告：不想被AI团灭，关键在融合新生

2025年4月20日11时作者新智元

内外夹击。但最近ACM的博客文章，提出了耳目一新的观点：GenAI是文科和计算机科学复兴的唯一希望。

Tensor-003 TensorCore架构

2025年4月12日19时作者 GiantPandaCV

l架构被虐成狗了. 而Volta这一代的架构规划是在2013年, 应该有可能是在2015年附近得到了

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

2025年4月3日16时作者新智元

PERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，

PDF识别大模型 olmOCR-7B-0225-preview

2025年2月27日16时作者 NLP工程化

A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.

神经可解释推理 (NIR)

2025年2月20日8时作者 NLP工程化

本文提出基于‘推理等变性’原则的神经可解释推理 (NIR) 框架，通过生成与执行并行实现深度学习模型的可解释性验证。

2026 年 1 月
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31