月度归档: 2025 年 5 月
大模型终于通关《宝可梦蓝》!网友:Gemini 2.5 Pro酷爆了
谷歌CEO劈柴哥宣布大模型Gemini成功通关《宝可梦蓝》,成为首个登顶的大型语言模型。Gemini在游戏过程中详细思考每个步骤,展示了其理解游戏的能力和局限性。
喝点VC|a16z对话Meta CTO:应用已死?后手机时代的AI原生交互范式——“不是点开应用,而是表达意图”
?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望
CVPR 2025 如何稳定且高效地生成个性化的多人图像?ID-Patch带来新解法
本文提出ID-Patch方案,用于解决多人图像生成中的身份特征泄露问题。通过ID Patch将身份特征转化为小尺寸RGB图像块,精确指定每个人的位置,并与文本提示共同输入增强人物面部真实性。实验结果显示其在身份还原和位置匹配上表现优秀,且生成效率快。
阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首
本文介绍了一个名为DianJin-R1的金融大模型,它融合了先进的技术和全面的数据支持。该模型包含一个开源的推理数据集DianJin-R1-Data,并且已向公众开放了两个大型预训练模型DianJin-R1-7B和DianJin-R1-32B。通过监督微调和强化学习,这些模型在复杂金融任务中的表现卓越。