AGI Hunt
Grok 4刷新ARC-AGI-2纪录:15.9%碾压所有公开模型,我们离AGI还有多远?
xAI模型Grok 4在ARC-AGI-2测试中得分15.9%,成为全球最强公开AI模型,打破噪声屏障展示流体智能能力。
刚刚,Grok 4发布,「人类最后的考试」中拿下50.7%,碾压所有对手,游戏结束?
Grok 4现已对X Premium+订阅者开放,性能超越了包括OpenAI o3、Google Gemini等在内的多个领先模型,在关键测试中得分高达73分,并在人类最后的考试上取得50.7%的成绩。
吴恩达推出LLM 后训练免费课程,覆盖三大调优方法:SFT、DPO、RL
吴恩达发布新课程介绍如何将LLM转化为能遵循指令的助手,课程内容涵盖三种后训练方法:监督微调、直接偏好优化与在线强化学习,并强调动手实践的重要性。
Sam Altman采访回应扎克伯格的Meta人才挖角:很好,这周就会会他
Sam Altman在面对Meta挖角OpenAI人才时表现出表面上的淡定,但内心饱含痛苦。他承认开源AI成为新的使命召唤,而Meta则用金钱和开放理念吸引顶尖人才,造成身份危机。
Proactor AI:首个自主行动的AI 智能体,无需唤醒,就能主动识别对面是个骗子
Proactor是世界上第一个自主行动的AI队友,能感知、思考并主动识别谎言或欺骗行为,并提供实时摘要、关键要点和待办事项等服务。它在会议中提供实时分析和建议,适用于销售、招聘、媒体和教育等多个场景。
马斯克:Grok 4 周三发布
马斯克宣布Grok 4将于明日发布,预计将提升OpenAI的压力。据泄露消息,Grok 4在HLE测试中得分45%,可能追平甚至超越OpenAI。七月可能是AI竞赛最激烈的月份。
谢赛宁摊上事了!被曝论文藏「只给好评」提示词操纵AI 审稿
NYU教授Saining Xie在自己的论文中藏了引导AI给出好评的提示词,引发学术界争议。事件揭示了AI时代学术评审的新挑战及诚信边界问题。