Grok 4 逆天跑分成绩曝光,AI 首次攻破人类最后考试 HLE!

这个夏天,有多个新模型(如Grok 4、DeepSeek-R2等)备受期待。近期,关于疑似Grok 4 / Grok 4 Code的基准测试截图引发了广泛关注。这些数据虽然没有被官方认证,但表现出色,尤其是HLE和GPQA测试中表现突出。

速递|Meta系初创公司Nectar Social获860万美元融资,用AI解码全网消费动因与情绪

初创企业Nectar Social专注于提供社区管理、营销和分析工具,帮助企业通过社交媒体监测客户动态。该公司在上季度获得了860万美元融资,并从True Ventures和GV等投资方筹集了1060万美元。

继“氛围编程”,“上下文工程”后Andej Karpathy再造新词:细菌式编程

Andej Karpathy 提出细菌式编程的概念,强调模块化、自包含和小巧的特点。他建议开发者在软件开发中模仿细菌基因组演化智慧,以构建高效、灵活的系统。但同时指出依赖管理问题可能导致‘依赖噩梦’。

速递|大模型比应用估值便宜?OpenAI、Anthropic增速碾压同行却估值倍数低

OpenAI和Anthropic作为人工智能领域的领军者,通过快速增长实现了远超同行的估值倍数。尽管他们仍需面对持续烧钱的问题以及新兴竞争对手的压力,但其在模型开发方面的实力使其成为该行业的价值投资标的。

想做成好的AI应用,先从把它砍成“一小时版本”开始「吴恩达老师开发心法」

吴恩达建议通过缩减项目范围来解决有限时间开发难题。他提出的关键步骤是:学习相关技术,并动手构建和实践,特别是在使用AI编程助手提升效率的情况下。通过具体实例展示了如何从一个复杂的构想逐步精简至可立即开始的小功能点。