速递|红杉中国进军AI测评赛道:xbench为何要“摆脱智力题”考察AI的真实效用?

红杉中国推出全新AI基准测试xbench,采用双轨评估体系和长青评估机制,旨在提高AI系统在真实场景中的效用价值。该测试包含科学问题解答和中文互联网深度搜索两个核心评估集,并提出多项创新举措以解决现有评测方法的问题。

速递|OpenAI CFO解读64亿美元收购:ChatGPT5亿周活用户之后,将开启”AI硬件新时代”

OpenAI首席财务官莎拉·弗莱尔表示,AI硬件将推动ChatGPT订阅量增长,并开启”计算新时代”。她认为与乔尼·艾维公司合作投资可能带来回报,而这种新型硬件设备有望让全球更多用户接触OpenAI技术。

深度|拿下3亿美元融资后,AI金融独角兽Airwallex全球首发支付AI代理金融

金融科技独角兽Airwallex完成3亿美元F轮融资,估值达62亿美元。公司业务从支付扩展至全球企业账户、支出管理等全链条服务,并已持有全球60余张金融牌照。通过AI代理金融,Airwallex希望为企业提供智能化的财务解决方案。

大神都惊了!OpenAI o3模型单挑Linux内核,竟揪出一个0-day高危漏洞

文章介绍了一位安全研究员使用OpenAI的o3模型发现Linux内核中SMB实现的一个远程0day漏洞(CVE-2025-37899),相较于Claude Sonnet 3.7,o3在基准测试中的表现更优,并指出其报告风格类似于人类编写的安全报告。同时,文章强调了o3模型在未来漏洞研究中的潜力和价值。