MiniCPM-o 2.6:视觉、语音和多模态流式能力达到了GPT-4o级别
MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。
MiniCPM-o 2.6 是性能最佳的多模态大模型之一,支持视觉、语音和多模态流式能力达到GPT-4级别,并新增了可配置声音功能及情感/语速/风格控制等新特性。
Codestral 25.01 正式发布,优化了80多种编程语言支持,并在 LMsys Copilot 排行榜中排名第一(并列)。
香港大学提出MiniRAG,一种专为极简和高效设计的新型RAG系统,解决SLMs在语义理解和文本处理上的局限性。通过引入语义感知的异构图索引机制和轻量级拓扑增强检索方法,MiniRAG在使用SLMs时与基于LLM的方法性能相当,同时节省25%存储空间。
AMD推出的Agent Laboratory利用自主大型语言模型支持科学发现流程,通过文献综述、实验和报告撰写三个阶段生成研究报告和代码仓库,显著提高研究质量和效率并降低成本。
本文提出了一种新的推理框架Search-o1,通过自主知识检索和文档内推理模块提高了大型推理模型的知识获取能力,显著提升了其在复杂任务中的表现,并展示了其在解决知识不足问题上的潜力。
MiniPerplx是一款基于Vercel AI SDK的人工智能搜索引擎,支持网页、学术论文和YouTube视频搜索等多功能,并能根据用户Query规划并调用合适的工具以获取最新信息。
OpenAI CEO Sam Altman反思了OpenAI的发展历程,并展望了到2025年人工智能代理可能加入劳动力市场的前景。他强调逐步将伟大工具交给人们将会产生广泛积极的影响。
微软在MEDEC研究中意外公布了其部分主要闭源大型语言模型的参数规模,包括Claude 3.5 Sonnet (175B),GPT-4 (~1.76T),Claude 3.5 Claude 3.5 (8B)和o1-preview (~300B)。