大语言模型
上海交大位列第一,登榜不足百人,这期世界科学智能大赛解读来了!
学习解读第三届世界科学智能大赛。黄仁勋提出大语言模型、具身智能、AI4S是关键方向。新增全球规模最大的AI4S赛事。理解AI4S赛题:训练“分子画家”AI生成化学结构,加速新药和新材料研发。
大模型是怎么“思考”的?五分钟看懂大模型的底层逻辑!
近年来ChatGPT爆火,让大语言模型走进大众视野。本文系统梳理了其原理、训练方式及其应用,涵盖数据、架构和训练三大要素,并展示了微调与实际应用场景,如客户服务、内容创作等。
ACM MM 2025 LGM3A研讨会征稿:探索大模型与多模态的融合创新
我们诚挚邀请您提交论文参加ACM Multimedia 2025大会期间的LGM3A Workshop,该研讨会聚焦于大型生成模型在多模态应用中的潜力。
OpenAI发布了一份32页的《智能体实用指南》
OpenAI发布《智能体实用指南》,讲解如何构建基于大语言模型的智能体,涵盖基础概念、场景适用性、核心组成、流程控制、安全机制等,为开发者提供从零开始的方法。
比R1快8倍,智谱开源GLM-Z1系列,实测 Agentic AI 也能极速深度推理!
智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。
开源本地部署的GraphRAG chatwiki,支持DeepSeek接入微信里的聊天机器人
ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。