资讯
news
大模型“六小虎”,拿下4200万大单
上海大模型独角兽阶跃星辰中标4199.9万元智算云服务平台源代码采购项目,这是其首次现身招标项目。该公司成立于2023年4月,由前微软全球副总裁姜大昕博士创办,并于近日完成数亿美元B轮融资。
ViT作者飞机上也要读的改进版Transformer论文,花2个小时详细批注解读分享出来
Lucas Beyer分析了微软提出的DiffTransformer论文,指出其通过两个注意力头的差值来改善Transformer模型信噪比的问题。尽管存在一些质疑,Beyer认为该方法具有简单而有效的创新点,并强调需要更多图表和实验结果以验证其潜力。