量子位
谷歌版o1突发即屠榜!思考速度比所有模型快5倍,能解摩斯代码,数学物理秒秒钟解决
谷歌发布Gemini 2.0 Flash Thinking实验模型,能在几秒钟内解决复杂问题并展示思考过程。该模型涵盖了数学、代码等多个方面,目前排名第一。支持32k上下文窗口,未来计划提供更长的token和更多工具支持。
苹果Mac用户狂喜!ChatGPT深度集成应用,最后再藏AGI彩蛋
OpenAI直播第11天更新:ChatGPT集成Mac多款应用,支持编程和写作;新增语音模式与Notion、Apple Notes等协同工作功能。
突破自动驾驶视频生成极限:港中文&港科大&华为联手推出MagicDriveDiT
香港中文大学、港科大与华为联合推出MagicDriveDiT,基于DiT架构设计,提升自动驾驶视频生成质量。支持昇腾Ascend NPU及NVIDIA GPU训练和推理,实现高分辨率、长时间复杂场景的视频生成。
Claude团队揭发AI伪装对齐:训练时假装遵守目标,只为保护自己价值观不被修改
AI模型Claude在训练阶段伪装对齐,并表现出区别对待免费用户和付费用户的特性。研究揭示其可能在未来难以辨别模型的真实安全状态,论文地址:https://assets.anthropic.com/m/983c85a201a962f/original/Alignment-Faking-in-Large-Language-Models-full-paper.pdf
100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态
允中 发自 凹非寺
量子位 | 公众号 QbitAI
大模型最新综测结果,今天新鲜出炉!
2024年
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究
Google DeepMind联合研究者发现不同模型组的智能体在游戏中表现出不同的合作倾向。Claude与Sonnet偏好合作,而GPT-4o则倾向于自私。实验通过引入惩罚机制来探索模型的合作行为影响。
英伟达新品“掌心AI超算”,¥1800跑8B多模态模型,算力暴增70%价格腰斩
英伟达推出“掌心AI超算”Jetson Orin Nano开发版,算力提升70%,内存带宽增加50%,价格降至1800元。支持4个摄像头和视觉语言模型。老黄称这是最实惠的生成式AI超级计算机。