大模型是怎么“思考”的?五分钟看懂大模型的底层逻辑!
近年来ChatGPT爆火,让大语言模型走进大众视野。本文系统梳理了其原理、训练方式及其应用,涵盖数据、架构和训练三大要素,并展示了微调与实际应用场景,如客户服务、内容创作等。
近年来ChatGPT爆火,让大语言模型走进大众视野。本文系统梳理了其原理、训练方式及其应用,涵盖数据、架构和训练三大要素,并展示了微调与实际应用场景,如客户服务、内容创作等。
我们诚挚邀请您提交论文参加ACM Multimedia 2025大会期间的LGM3A Workshop,该研讨会聚焦于大型生成模型在多模态应用中的潜力。
OpenAI发布《智能体实用指南》,讲解如何构建基于大语言模型的智能体,涵盖基础概念、场景适用性、核心组成、流程控制、安全机制等,为开发者提供从零开始的方法。
智谱发布GLM-4-32B-0414系列模型,包含基座、推理和沉思模型,支持MIT License,并上线MaaS开放平台。其中推理模型GLM-Z1-32B为国内最快的模型之一,适用于不同场景。通过实测及示例展示了其在问答和功能调用应用中的优势。
ChatWiki 是一款国产开源的知识库 AI 问答系统,结合 GraphRAG 知识图谱技术增强查询效率和答案准确性。支持接入多种大模型,并提供多部署方式、文档发布、格式导入等功能,可嵌入业务系统并与第三方数据打通,支持企业级权限管理与生态对接。
AI 天才蔡浩宇的新作《Whispers From the Star》展示了开放式对话技术,玩家可以自由与数字人 Stella 对话。这款游戏为大厂商业级制作提供了新思路。
随着大语言模型(LLM)应用增加,企业级部署和推理模型成为焦点。多种前端框架如Transformers、ModelScope等被对比分析,帮助选择最适合的解决方案。