多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满
智源研究院联合多所高校发布三款向量模型,包括BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索中表现出色,并登顶多项测试基准。BGE-Code-v1针对代码检索优化,提升跨语言信息获取能力;BGE-VL-v1.5则增强通用多模态理解与检索性能;BGE-VL-Screenshot专为视觉化文档任务设计。智源研究院将持续深耕向量模型和检索技术,推动相关领域发展。
智源研究院联合多所高校发布三款向量模型,包括BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索中表现出色,并登顶多项测试基准。BGE-Code-v1针对代码检索优化,提升跨语言信息获取能力;BGE-VL-v1.5则增强通用多模态理解与检索性能;BGE-VL-Screenshot专为视觉化文档任务设计。智源研究院将持续深耕向量模型和检索技术,推动相关领域发展。
谷歌发布Jules编程智能体,可帮助开发者提交代码并处理多种编码任务。该工具在GitHub上提供了五个免费任务,并计划今年晚些时候推出额外功能。与Copilot等竞争对手相比,Jules提供了一个更用户友好的界面和集成的解决方案。
约14%的美国16岁以上人群每天使用ChatGPT、Gemini或Meta AI,较六个月前增长3个百分点。谷歌的Gemini表现出最强劲的增长势头,用户利用这些平台进行购物、价格比较和产品研究的比例达25-45%。
谷歌DeepMind发布了AlphaEvolve模型,这是一个基于Gemini的独特编码代理,可用于设计高级算法、改进AI芯片设计以及解决数学和计算机科学领域中的其他重大问题。该模型展示了自主进化的潜力,并在内部应用中取得了显著效果,同时有望推进更广泛的科研和技术领域的进步。
谷歌DeepMind的AlphaEvolve通过优化算法和设计新的矩阵乘法方法,显著提高了数据中心和芯片设计效率,并解决了多个数学问题。
谷歌DeepMind发布AlphaEvolve AI智能体,能够发现跨越数百行代码的复杂算法,并已在谷歌数据中心和软件中应用提升了性能。其成果包括提高了Borg管理系统恢复资源效率0.7%,Gemini加速运算23%以及解决困扰数学家长达300年的接吻数问题。
Harvey 成为 OpenAI 后备,宣布将采用 Anthropic 和谷歌的基础模型。此举显示 Harvey 内部基准测试结果显示不同基础模型在法律任务上表现各异。
NeuralGCM是谷歌提出的一种基于物理模拟的气象模型,它在预测暴雨、台风等方面表现优异,并已开源供各大气象机构测试。通过神经网络和深度学习技术处理小尺度过程,相比传统GCMs更精确。
2025年春季AI模型使用趋势报告显示,DeepSeek R1的使用率大幅下降超过50%,OpenAI在新功能推出后迅速增长。文本领域中,GPT-4.1和Gemini 2.5 Pro表现优异;视频生成方面,Kling-2.0-Master迅速崛起;推理模型方面,Poe订阅者使用Gemini 2.5 Pro比例增加;图像生成市场激烈竞争;音频转文本(TTS)领域ElevenLabs保持主导地位。