资讯
news
AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零
新基准ENIGMAEVAL对高难度问题提出挑战,显示主流推理模型在面对复杂谜题时准确率极低。研究者使用原始多模态谜题进行评估,发现前沿语言模型即使在普通谜题中表现也仅7.0%,且难以解决困难谜题。
像Sora一样,用物理模拟方式生成视频
专注AIGC领域的专业社区报道了麻省理工学院等机构联合开源的创新3D交互视频模型——PhysDreamer(简称‘PD’)。它能精准模拟物理世界的物体动态变化和复杂交互细节。
微软开源创新框架:可将DeepSeek,变成AI Agent
微软发布OmniParser V2版本,可将大语言模型变成AI Agent,识别精准度提升39.6%,微软开源OmniTool和Gradio支持开箱即用。
杀疯了!问小白上线Deepseek R1 671B满血版:零延迟、不限次、全免费、随便用
问小白接入Deepseek满血版671B:速度快到飞起,免费且稳定。多端支持,包括iOS、安卓及PC,提供文档分析、图片分析等功能。