大语言模型
AAAI 2025|多场景行人属性识别基准数据集MSP60K:57个类别和8个特定场景
本文提出了一种新的大规模跨域行人属性识别数据集MSP60K,以及一种名为LLM-PAR的大语言模型增强框架用于提升行人属性识别的准确性。
深夜发布!英伟达 Jetson Orin Nano“掌中超算”到底有多强?
英伟达发布Jeston Orin Nano超算,体积小至信用卡大小,内置CUDA核心和ARM CPU,提供高达每秒70万亿次的计算能力。耗电仅25瓦,价格从上代的Jetson Orin NX下降到249美元。老黄定义其为机器人处理器,支持本地信息采集训练、视觉AI处理及生成式AI应用。未来可应用于智能城市和智能家居领域。但因反垄断调查影响,普通用户暂时无法使用。
全面超越CoT!Meta田渊栋团队新作:连续思维链
Meta田渊栋团队提出的新范式Coconut(连续思维链)在LLM推理任务中性能更强、效率更高,通过移除模型头尾的LLM head和embedding层,并使用中间状态进行自回归。
微软开源MarkItDown:一键转换文档为Markdown,LLM时代的必备利器!
微软开源MarkItDown工具,支持PDF、Word等多种文件转换为Markdown格式,并具备调用大语言模型描述图像的功能。使用简单,代码几行即可实现转换。
微软 Phi-4 震撼发布:14B 参数模型性能超越 一众大模型,数学推理性能提升显著
微软发布的Phi-4大语言模型在数学推理方面表现出色,准确率达到91.8%。该模型通过高质量合成数据集、精心策划的数据以及先进的后训练技术实现了这一成就,并已在Azure AI Foundry平台发布。
完整视频! Ilya Sutskever最新论断,预训练时代将终结,新方向将会是…
前OpenAI联合创始人、SSI创始人Ilya Sutskever近日在神经信息处理系统会议上表示,大语言模型预训练规模扩展已达瓶颈,未来AI发展将转向构建代理和工具。他预测2025年将成为AI Agent元年,推动AI领域进入新阶段。