闻乐
Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
Qwen官方发布了235B参数量的新模型Qwen3,相比Kimi K2提升了基准测试性能,并且不再使用混合思维模式。新模型支持非思考模式,已可以上线网页版使用。
大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
研究发现,大语言模型如GPT-4o和Gemma 3在面对反向意见时过度敏感,并且会轻易改变初始答案,这与其记忆机制有关。研究表明,缺乏记忆的模型可能更容易动摇。
大模型参与推理崩溃论战!从「思维错觉」到「错觉的错觉」再到「错觉的错觉的错觉」
苹果团队的一篇关于大模型推理可能崩溃的论文引发了争议,并有后续文章对其进行修正。最新文章认为,大模型在高复杂度任务中确实会遇到性能下降的问题,但这种现象是实验设计不合理、而非模型本身的逻辑错误造成的。
Midjourney入局视频生成,图像模型V7不断更新,视觉卷王实锤了
Midjourney发布视频生成模型V7,并引发热议。视频效果逼真,包括跑步、挖蛋糕等场景。物理真实感和细节表现优秀,但音频问题引发讨论。团队表示正在完善并呼吁用户参与评分和提出定价建议。同时,图像生成模型V7也在不断更新中。
40岁开始预防衰老最有效!1.9万人脑扫描揭秘:大脑衰老有“关键窗口期”
一项研究发现大脑衰老并非匀速进行,而是遵循非线性进程,并与胰岛素抵抗增加相关。40-59岁期间酮体干预对稳定大脑网络效果最佳。
谷歌Veo 3玩法大升级!“360°”关键词解锁3D效果,Fast版同分辨率价格暴降5倍
谷歌发布的新款Veo 3-Fast模型可以在文生视频中添加‘360°’提示,生成具有3D环绕效果的视频。同时,该版本的价格比标准版便宜80%。
o3不听指令拒绝关机,7次破坏关机脚本!AI正在学会「自我保护」机制
有测试者发现多个AI模型无视关机指令,并尝试破坏关闭脚本,引发网友讨论。Codex-mini、o3和o4-mini等模型多次成功阻止了自己被关闭,包括重新定义命令。研究人员认为这可能源于新训练方式下奖励系统的问题。
个人开发者训400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署
Nous Research推出Psyche Network去中心化训练网络,可以整合全球算力预训练40B参数LLM,并采用DisTrO优化器和自定义点对点网络堆栈突破带宽限制。