北大发布学术搜索评测ScholarSearch:难倒一众DeepResearch的“开卷考试”
北京大学DS-Lab发布ScholarSearch数据集,评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳,仅凭推理无法解决复杂问题,需结合搜索功能以提高准确率。
北京大学DS-Lab发布ScholarSearch数据集,评估LLMs在学术研究中的信息检索能力。结果显示现有模型普遍表现不佳,仅凭推理无法解决复杂问题,需结合搜索功能以提高准确率。
本周四小米发布首款使用小米商标的AI智能眼镜,定位面向下一个世代的个人智能设备。采用保守D型方框设计,支持语音通话和拍照录像。重量约为40克至60克不等,可选择多种颜色及电致变色镜片,内置1200万像素摄像头支持高清晰度视频录制,并具备实时翻译功能、同声传译支持多语言互译。
谷歌DeepMind团队发布AlphaGenome模型,可在一秒内精确定位DNA序列变异,并全面超越现有技术。该模型能预测多种基因组特征,助力解析疾病机制和癌症研究。
小米发布新款AI眼镜,重量40g、续航8.6小时,售价1999元起。核心功能包括拍照录像、翻译支付等,与竞品相比具有更轻、续航更长的优势。雷军在发布会上强调了这款AI眼镜作为’随身AI入口’的作用。
千里科技发布全新智能驾驶辅助方案,并明确供应商站位。公司推出RLM大模型和强化学习技术来提升自动驾驶性能,同时正在进行传感器的全链路整合研发。该公司强调自研核心零部件与成熟外部供应商产品相结合的优势,目标成为智驾解决方案的关键供应商。
一个包含500万视频数据的OpenS2V-5M数据集和一个全新的OpenS2V-Eval评测框架。该