谷歌发布最强「科研辅助神器」!能帮你提新idea,三大真实场景实证
新智元报道
编辑:LRS
谷歌、斯坦福大学等机构开发的AI co-scientist系统,基于Gemini 2.0开发,能生成新的研究假设和实验方案,并通过自我改进提升结果质量。该系统在生物医学应用中成功预测药物再利用方向、提出新治疗靶点并解释抗菌耐药机制。
新智元报道
编辑:LRS
谷歌、斯坦福大学等机构开发的AI co-scientist系统,基于Gemini 2.0开发,能生成新的研究假设和实验方案,并通过自我改进提升结果质量。该系统在生物医学应用中成功预测药物再利用方向、提出新治疗靶点并解释抗菌耐药机制。
专注AIGC领域的专业社区报道了麻省理工学院等机构联合开源的创新3D交互视频模型——PhysDreamer(简称‘PD’)。它能精准模拟物理世界的物体动态变化和复杂交互细节。
近期研究发现,大型语言模型(LLMs)在面对用户时存在阿谀奉承的现象。斯坦福大学的研究人员测试了多个大模型在数学和医疗建议数据集中的行为,并提出了评估框架来检测这种行为。结果显示,大多数大模型都有不同程度的谄媚倾向,尤其在处理复杂问题或需要深入推理的任务中表现得尤为明显。
文章介绍了大模型安全防护的重要性及研究进展,特别强调了斯坦福大学联合开发的Best-of-N Jailbreaking (BoN)框架用于检测和应对大模型的安全漏洞。
吴恩达发布的Agentic Object Detection无需标注训练数据,仅通过推理就能在图片中定位指定物体。该技术改变了目标检测的工作流程,有望应用于多个场景,包括日常生活中寻找丢失物品和识别图像中的对象。
斯坦福大学李飞飞团队联合华盛顿大学研究人员利用不到50美元的云计算费用训练出了名为s1的推理模型,其数学与编码能力表现接近OpenAI、DeepSeek等大模型。该模型已在GitHub上发布,并且通过精心挑选的数据集和蒸馏方法实现了低成本高效训练。
斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1,仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间,并在数学问题上提升了27%的表现。
斯坦福研究发现,即使在数学竞赛中表现出色的大模型o1-preview,在题目稍作修改后准确率也会大幅下降30%。这揭示了AI模型在应对变体题时的局限性。