OCR-Reasoning:揭秘多模态大模型在复杂图文推理中的真实能力

OCR-Reasoning 基准评估多模态大模型在复杂图文信息的深度推理能力,涵盖6种核心推理能力及18种实际任务。数据来源广泛,包括互联网图片和真实世界照片,如金融报告分析、发票识别等。

记忆力下降83%!206页研究发现:用ChatGPT越多,大脑越笨

近期MIT研究发现,使用AI语言模型如ChatGPT可能会降低写作任务的认知负荷,但同时也可能影响记忆、批判性思维和写作技能。该研究通过脑电图记录参与者的大脑活动,并收集反馈数据,揭示了不同组别在写作质量、神经活动以及认知成本方面的差异。

Agentic CoT驱动,清华DO-RAG领域问答性能飙升33%,远超FastGPT、Dify

DO-RAG是清华提出的可扩展且可定制的混合问答框架,结合多级知识图谱构建与语义向量检索,采用新颖的Agentic CoT架构从非结构化文档中提取结构化关系,通过融合图检索和向量检索结果生成上下文感知的回答,并引入基于事实的细化步骤减少幻觉。