大模型IMO25数学竞赛成绩公布了
大模型在IMO数学竞赛中的表现:Gemini以超30%总成绩拔得头筹,o3和o4-mini紧随其后。MathArena对五款模型进行评估发现多数模型在几何题上得分较低,且存在格式优化过度的问题;Grok 4则因答案过于简略而受到批评。
大模型在IMO数学竞赛中的表现:Gemini以超30%总成绩拔得头筹,o3和o4-mini紧随其后。MathArena对五款模型进行评估发现多数模型在几何题上得分较低,且存在格式优化过度的问题;Grok 4则因答案过于简略而受到批评。
Oleve是一家仅有4人的AI创业公司,其产品Quizard和Unstuck AI在社交平台获得大量关注并实现快速增长。通过订阅制和营销手段,他们在9个月后实现盈利。Oleve采用精益增长策略、极简团队架构及自动化流程来高效运作,并利用AI技术改进决策过程。
Meta调整其AI组织架构,整合3400多人团队,头号负责人亚历山大·王管理AGI研究、产品应用和Llama研发等多方面工作。与字节跳动类似,强调对齐AI技术并实现商业化。
Meta挖走两位苹果高级AI工程师,包括资深语言模型研究人员汤姆·冈特和显示技术专家马克·李。Meta承诺给予优厚薪酬以挽留人才,并将他们安排在扎克伯格附近工作,打造业内最顶尖团队。
Lovable,一个仅成立8个月的瑞典AI初创公司,在短短几个月内迅速获得2亿美元融资并成为独角兽。该公司通过自然语言帮助非编程用户生成网站和应用,其7500万美元年度经常性收入(ARR)和3万名付费用户的增长速度令人印象深刻,并吸引了众多行业巨头的投资。
几千人盲投,Kimi K2超越DeepSeek拿下全球开源第一!歪果网友们纷纷点赞,Kimi在多项能力上紧追顶尖闭源模型。GitHub和Hugging Face下载量近10万,Kimi官方因访问量大回应称API过慢。关于K2架构继承自V3并进行了参数调整的解释出炉。随着开源力量崛起,人们认为未来在性能和成本之间不再需要取舍,更多人对开源模型抱有期待。