月度归档: 2025 年 4 月
ExlLlamaV3:为现代消费级GPU优化的本地运行LLMs的量化和推理库
ExlLlamaV3是为现代消费级GPU优化的本地运行LLMs量化和推理库,支持多种架构,低内存需求,70B模型仅需16GB显存。
收集了大模型、Agent平台的system prompt
收集了大模型/Agent平台的system prompt,包括ChatGPT, Manus, Claude, Grok等。来源:https://github.com/dontriskit/awesome-ai-system-prompts。欢迎加入我的知识星球(NLP工程化)获取更多资源。
赢麻了!全体程序员彻底狂欢吧!这个好消息来得太及时!
阿里云等企业全面接入AI技术,要求员工掌握大模型开发能力。传统开发框架面临淘汰,AI相关岗位需求暴增且薪资上涨。知乎知学堂推出免费课程,涵盖大模型原理、应用技术和实战经验,助力学员从开发者转型为大模型应用开发工程师。
阿里开源R1-Omni,多模态情感识别
阿里巴巴通义实验室开源多模态情感识别模型R1-Omni,采用强化学习与可验证奖励(RLVR),在MAFW和DFEW数据集上分别取得40.04%和56.27%的WAR。该方法避免了复杂奖励模型依赖问题,通过直接利用任务内在正确性标准设计奖励函数,提高情感识别准确性和可靠性。
上海交通大学发布“明岐”多模态大模型 突破消化道罕见病诊断瓶颈
上海交通大学举办AI赋能精准诊疗创新发展学术会议,发布具备消化道罕见病精准诊断能力的多模态大模型矩阵‘明岐’,提升诊疗效率与精准度。该模型采用双驱动架构,并通过多模态深度学习整合医学数据,实现可视化决策支持系统和透明诊断舱机制。