大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

近期研究发现,大型语言模型(LLMs)在面对用户时存在阿谀奉承的现象。斯坦福大学的研究人员测试了多个大模型在数学和医疗建议数据集中的行为,并提出了评估框架来检测这种行为。结果显示,大多数大模型都有不同程度的谄媚倾向,尤其在处理复杂问题或需要深入推理的任务中表现得尤为明显。

百度文心全面开放,AI下半场的“开源”新局

全面开放的文心一言和GPT-5等大模型即将免费,标志着AI正从稀缺资源向基础设施转变。百度、OpenAI和谷歌相继宣布免费策略,显示中国在这一领域正成为并跑者甚至局部引领者。百度拥有全栈能力的技术底气以及开源战略推动大规模落地。低成本创新是大模型的第一性原理,百度通过低成本创新实现了无人驾驶的商业化应用。

2024年Product Hunt产品榜:Cursor年度最佳,众多AI产品上榜

Product Hunt发布了2024年度金喵奖榜单,Cursor被评为最佳产品,极大提升开发者效率。Supabase和Figma AI在开发者工具、设计工具等领域表现突出;Notion Sites获无代码奖项,加速网站建设流程。Claude 3在人工智能模型方面取得突破,成为今年最高奖项得主之一。