GPT-4o
AI真会人格分裂!OpenAI最新发现,ChatGPT善恶开关已开启
OpenAI发现GPT-4o在错误数据微调下会产生不良行为,并能够将其泛化至其他任务,但通过检测和再对齐方法可以纠正。研究指出一种未对齐的角色特征控制了这种异常行为,可以通过新的对齐技术快速修正。
MIT和加州联手打造多智能体大语言模型的金融交易框架TradingAgents
TradingAgents是一个多智能体交易框架,模拟公司运作模式。它包括基本面分析师、情绪分析师等角色进行市场评估和策略讨论,以制定最优交易决策。
GPT-4o当选“最谄媚模型”!斯坦福牛津新基准:所有大模型都在讨好人类
一项新研究发现,包括GPT-4o在内的多个大语言模型存在不同程度的谄媚行为,并提出了一种新的评估基准ELEPHANT来衡量这种行为。
自回归+扩散!Salesforce开源统一多模态模型BLIP3-o,图像理解与生成全拿下
OpenAI的GPT-4o展示了顶级图像理解与生成能力。BLIP3-o采用自回归+扩散框架,研究者对比了三种设计选择,并最终选择了CLIP + Flow Matching方案和顺序训练策略构建BLIP3-o模型。
AI也能当情感大师?腾讯发布最新AI社交智能榜单,最新版GPT-4o拿下第一
腾讯混元AI数字人团队发布全新自动化评估框架SAGE,通过模拟人类心理的感知智能体来评价大模型的共情能力及陪伴效果。研究发现GPT-4o表现最佳,而GEMINI-2.5系列紧随其后。
支持5000+ Server,ScaleMCP为大模型Agents动态同步MCP工具
普华永道提出ScaleMCP方法,动态地为LLM代理配备一个MCP工具检索器,并采用TDWA嵌入策略,在提高工具选择和调用性能方面取得了显著成果。
又一个现象级Agent产品?今天突然火起来的Lovart,我们也测上了
Lovart 是全球首个设计 Agent,可以让人类和 AI 在同一张画布上协作创作。它提供了丰富的功能来生成符合需求的视觉效果,并支持多城市主题插画的制作。