学术
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
本文介绍了来自北京大学和华为的研究团队对量化技术在大语言模型中的应用及其影响进行了研究。他们发现量化会显著降低大模型的基本数学能力,尤其是在处理算术任务时表现更差。研究者提出了理论模型来解释这一现象,并通过实验验证了其结果。
可以实现零代码开发的OPPO智能体平台,到底强在哪?
第三届中国高校计算机大赛——智能交互创新赛在杭州举行,OPPO提供技术支持和平台支持。哈尔滨工业大学的《雅韵智诵》获特等奖,四川大学的《走心》项目通过大模型代理集成到互动小说游戏中实现心理健康筛查。OPPO发布智能体开发平台,为开发者提供更多工具和支持,助力智能体技术的发展。
Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
Andrej Karpathy 回忆自己曾看好 RNN 和强化学习,但最终未能把握住大模型时代的到来。他指出,2015年已经认识到自回归语言模型的强大潜力,却错过了发展大规模预训练模型的机会。