阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首
本文介绍了一个名为DianJin-R1的金融大模型,它融合了先进的技术和全面的数据支持。该模型包含一个开源的推理数据集DianJin-R1-Data,并且已向公众开放了两个大型预训练模型DianJin-R1-7B和DianJin-R1-32B。通过监督微调和强化学习,这些模型在复杂金融任务中的表现卓越。
本文介绍了一个名为DianJin-R1的金融大模型,它融合了先进的技术和全面的数据支持。该模型包含一个开源的推理数据集DianJin-R1-Data,并且已向公众开放了两个大型预训练模型DianJin-R1-7B和DianJin-R1-32B。通过监督微调和强化学习,这些模型在复杂金融任务中的表现卓越。
知名 Go 大佬 Thorsten Ball 通过 315 行代码构建了一个编程智能体,展示了如何使用 Anthropic API 和工具访问能力实现简单的对话功能,并逐步添加了读取文件、列出文件和编辑文件等工具。
InfiGUI-R1 是基于 Actor2Reasoner 框架训练的一个 GUI 智能体,旨在提升其规划和反思能力。该模型通过小规模参数量实现了出色的表现,包括强大的 GUI 元素定位能力和复杂任务执行能力。
第42届国际机器学习大会ICML将于2025年7月在加拿大温哥华举行,共收到12107篇论文,接收率为26.9%。313篇论文被选为Spotlight Poster。高分论文包括Neural Discovery in Mathematics等,如字节跳动的MARS和伊利诺伊大学厄巴纳-香槟分校的EmbodiedBench。一些被拒论文同样值得讨论,因为这些论文的价值可能未被充分挖掘。
本文提出了一种名为Mona的方法,通过引入多认知视觉滤波器和优化输入分布,在调整少于5%的骨干网络参数的情况下,显著提升了视觉识别任务的效果。
这篇论文是2015年发布的《End-to-End Memory Networks》,它包含了当前大型语言模型的许多要素,如完全用注意力机制替代RNN、引入带键值投影的点积软注意力机制和堆叠多层注意力等。尽管其影响力不及后来的《Attention is all you need》