一招缓解LLM偏科!调整训练集组成,“秘方”在此上交大&上海AILab等
MLNLP社区发布了一项创新方法IDEAL,用于解决大型语言模型(LLM)在多任务场景下可能出现的偏科现象。通过调整监督微调(SFT)训练集组成,研究团队发现优化后的模型在多种领域上的综合性能显著提升。
MLNLP社区发布了一项创新方法IDEAL,用于解决大型语言模型(LLM)在多任务场景下可能出现的偏科现象。通过调整监督微调(SFT)训练集组成,研究团队发现优化后的模型在多种领域上的综合性能显著提升。
DynAlign 框架通过结合 GPT-4、SAM 和 CLIP,实现了跨域语义分割中前所未有的无监督动态类别对齐能力。该方法无需目标域标注,在智能驾驶和城市管理等场景中表现出色。
6月5日,2025长三角(芜湖)算力算法创新应用大赛上海站线下沙龙圆满结束。来自极视角、智谱AI等企业参加,聚焦大模型落地、IoT智能进化等多个维度。数据赛道和算法赛道全面开放解读,鼓励高校团队参与,提供百万奖金池。
清华大学与银河通用联合发布全开源OpenWBT操作系统,支持多种机型、跨虚实控制,实现高效机器人数据采集。论文提出Real-world-Ready Skill Space框架解决仿真实验室到实际应用的迁移问题。