量子位
航空发动机用上大模型:解决复杂时序问题,性能超越ChatGPT-4o实现SOTA|上交创智复旦
上海交通大学团队提出ITFormer,通过高效桥接时序数据和大语言模型,实现航空发动机运维中的即插即用特性,并在EngineMT-QA数据集上取得优异性能。
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
阿里发布Qwen-VLo多模态模型,具备增强细节捕捉能力、一句指令图像编辑及多语言支持。其不仅能连续生成图片,还能识别解释图像内容,并进行注释和分割。实测显示其生图效果令人满意。
DeepSeek-R2为什么还没发?
DeepSeek-R2再次被曝推迟发布,原因包括CEO不满意R2的表现和研发过程中缺少英伟达H20芯片。此前有传言称R1训练需要3万块H20、1万块H800和1万块H100,而R2预计会耗费更多算力资源。
紫东太初开源视觉神经增强方法,即插即用终结多模态幻觉 ACL 2025
通过识别并增强视觉敏感的注意力头,中科院自动化所联合新加坡国立大学、东南大学提出了一种高效解决大模型幻觉问题的新方法VHR。该技术量化注意力头对视觉信息的敏感度,并动态强化这些视觉感知头,显著降低模型基于语言先验而产生的幻觉现象。
Anthropic最新研究:Claude正悄悄进化为“情绪价值大师”
研究显示,越来越多成年人正将AI作为情感陪伴。Claude作为其中的一员,拒绝用户请求的情况很少,并且通常出于保护用户考虑。Clio工具用于匿名分析对话数据,以揭示用户的真实使用情况和需求。