谷歌 Gemini 2.5 Pro 成首款能理解 PDF 布局的 AI 模型了

近日,谷歌Gemini 2.5 Pro在PDF文档解析方面取得突破,能够全面理解其布局,引发人机协作模式和生产关系变革。这将催生新型出版、教育和司法系统应用,但也带来格式依赖风险、视觉霸权隐患及元数据黑洞等问题。

大模型是怎么“思考”的?五分钟看懂大模型的底层逻辑!

近年来ChatGPT爆火,让大语言模型走进大众视野。本文系统梳理了其原理、训练方式及其应用,涵盖数据、架构和训练三大要素,并展示了微调与实际应用场景,如客户服务、内容创作等。

百度悄咪咪上线手机版 Manus「心响」

据特工消息,百度将在4月25日开发者大会上发布一款名为「心响」的新产品,寓意为「心想事成」。该产品是一款以AI任务完成引擎为核心的手机端超级智能体,支持创建新任务、定时任务和基于百度地图的旅游规划等功能。