为什么千问模型总在AI基准测试中被「忽略」?
阿里的大语言模型Qwen在多项基准测试中总是『神秘失踪』引起热议。AI研究员指出,这可能反映了AI评测体系中的『偏见』问题。正如电动车市场榜单排除中国车企一样,AI领域似乎有意遗漏某些重要玩家。Panahi认为需要建立公平、全面和客观的评测体系,打破偏见以推动行业健康发展。
阿里的大语言模型Qwen在多项基准测试中总是『神秘失踪』引起热议。AI研究员指出,这可能反映了AI评测体系中的『偏见』问题。正如电动车市场榜单排除中国车企一样,AI领域似乎有意遗漏某些重要玩家。Panahi认为需要建立公平、全面和客观的评测体系,打破偏见以推动行业健康发展。
GPT-4.5知识截止日期更新至2024年6月引发热议,新版Turbo版在速度、准确性及上下文窗口方面提升。但其独特之处以及与最新发布的o1模型相比的优势尚待揭晓。OpenAI是否能在下周一发布这一惊喜仍需等待官方确认。
OpenAI的Sora在3710场视频生成比赛中以1151分登顶排行榜,领先其他竞争对手显著。此为全球AI技术较量之一,显示了Sora在AI视频生成领域的领先地位。
超级智能AI将与现有AI不同,表现出自主行动、强大推理能力及自意识等特征。Ilya Sutskever警告其行为难以预测,并指出这可能让AI成为与人类共存的智能个体。他创立实验室研究确保其安全的方法。
马斯克与OpenAI爆发矛盾。2015年OpenAI成立初期,马斯克提出要将其转型为盈利公司,并要求成为CEO。面对巨额研发资金需求,OpenAI拒绝了马斯克的提议。最终在2019年成立了非营利限制利润公司OpenAI LP。到2023年,两人因分歧加剧而成为竞争对手。
Meta 使用BLT(Byte Latent Transformer)新架构直接处理原始字节数据,显著提升模型规模、推理效率及鲁棒性。BLT已在GitHub开源,支持同时增加补丁和模型大小而不增加成本。
OpenAI的o1模型在Mensa智商测试中获得133分,表现优于98%的人类考生。此分数显示o1在标准化测试中的智能水平,并且可能预示着通用人工智能(AGI)的到来。
谷歌发布的NotebookLM推出了三面屏设计、交互模式等新功能,重新定义了用户与AI交互的方式。Plus版本还提供了更强大的功能。尽管存在使用体验问题,但整体来看,这款产品受到了用户的广泛关注和好评。