突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
专注AIGC领域的专业社区分享Meta的Memory layers研究进展,介绍其通过高效查询机制显著增加大模型参数而无需额外算力的方法。
news
专注AIGC领域的专业社区分享Meta的Memory layers研究进展,介绍其通过高效查询机制显著增加大模型参数而无需额外算力的方法。
阿里云、字节跳动等纷纷推出视觉理解模型降价策略,其中阿里云Qwen-VL-Plus降价81%,一元钱可处理600张720P图片,意在推动应用生态发展及吸引客户使用云计算服务。
矿业科技公司KoBold Metals完成5.37亿美元C轮融资,利用AI技术提高矿产勘探效率。该公司在赞比亚发现了一处可观的铜矿项目,计划投资20亿美元建设地下矿山。
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。