深度学习模型
爆料!DeepSeek R2即将发布:1.2万亿参数,成本暴跌97%,真王炸,还是空欢喜?
DeepSeek 新模型引发热议,混合专家模型 DeepSeek-R2 集齐 1.2 万亿参数和 780 亿动态激活参数,成本比 GPT-4 低97.3%,引发广泛关注。
o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”
ChatGPT通过分析照片中的车牌和细节,准确猜出地理位置,从加州锁定具体小镇。作者分享了详细对话记录及思考过程,指出模型对视觉信息的解析能力有待提升。
免费用户狂喜!ChatGPT深度研究轻量版开放,实测+对比+白嫖教程全在这!
OpenAI 推出轻量版深度研究功能,允许所有用户(包括免费用户)使用该功能。轻量版基于 o4-mini 模型,回复较短但效果几乎与满血版一致。
R1圈的新王者,腾讯混元-T1发布,首个混合Mamba推理模型~
腾讯发布混元-T1深度思考模型,在长文捕捉、优化长序列处理及强化学习训练等方面取得突破,已在公开benchmark和内部人工体验集上表现出色。
PDF识别大模型 olmOCR-7B-0225-preview
A 7B model in BF16 format, quantized to around 4GB, can be used on ordinary computers. Reference: https://huggingface.co/allenai/olmOCR-7B-0225-preview.