嚯!大语言扩散模型来了,何必只预测下一个token 人大高瓴&蚂蚁
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。
人大高瓴人工智能研究院与蚂蚁集团提出LLaDA模型,使用扩散模型替代自回归,挑战了大语言模型的固有限制,并在上下文学习、指令遵循和反转诗歌任务中超越GPT-4。
清华、中国人民大学与蚂蚁集团联合发布LLaDA模型,采用扩散方式打破自回归垄断,性能媲美Llama 3 8B。该模型颠覆大语言模型认知,采用掩码扩散模型训练范式,实现全局视角生成;在数学问题解答、多轮对话、代码生成等方面表现出色。相关资源包括论文和项目主页。
HyperAI超神经为大家整理了10个中文医学相关数据集,涵盖泌尿外科问答推理、中医古籍文本等。数据集预估大小从2.34MB到341.69MB不等,支持在线使用与加速下载,有助于推动机器视觉和大模型在医学领域的应用。
爱诗科技完成A2至A4轮融资,总金额近3亿元人民币。PixVerse用户量突破1200万,移动App在海外上线。公司提升技术研发能力、扩展算力资源以及建设人才团队,加速产品功能迭代与市场覆盖。
「AI Agent 构建与应用」OSC源创会·上海站·第 108 期技术沙龙成功举办,特邀四位嘉宾分享 AI Agent 的构建和应用场景。
蚂蚁集团推出1024程序员礼盒,包含多种大模型应用周边产品。其中无线便携小键盘、板砖造型腕枕、电子木鱼及U型枕均内置智能功能。通过手机触碰贴片,可访问CodeFuse代码助手、支付宝AI健康管家和AI生活管家等服务,全方位满足开发者、员工以及消费者的智能化需求。