月度归档: 2025 年 2 月
告别传统强化学习?上下文强化学习基座模型 OmniRL 让 AI “自学成才”
近日,香港中文大学AIRS团队提出OmniRL模型,通过大规模元训练和上下文强化学习方法解决AI泛化能力问题,实现从‘环境适应’走向‘能力泛化’的突破。
DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!
DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。
OpenAI,差评!
在过去几周,OpenAI因将在超级碗比赛中播出首则品牌广告而引起轰动。然而,该广告在《今日美国》广告测评表中仅排名第53位,并获得较低评分。整体而言,在今年的超级碗上,观众更偏好情感化和名人主题的广告。