MoE架构
DeepSeek推理快的支撑逻辑及知识图谱OneGraph等思考
2025年02月06日,星期四,大年初九,北京天气晴。Deepseek-R1近期引发广泛关注,摘要回顾了其蒸馏、推理速度等话题,并探讨知识图谱进展及RAG中Deepthink的使用思考。
微软医疗论文泄密:GPT-4o 200B 「大未必强」,Claude 175B 「小未必弱」
微软在最新发布的医疗 AI 评测论文中披露了多个头部 AI 模型的关键参数数据,引发关注。包括 MEDEC 在内的研究团队开发的 MEDEC 评测基准用于检验 AI 模型识别和纠正医疗文档错误的能力,列出了一系列令人瞠目的数据,引发了对 AI 领域技术路线、大模型架构与实际应用效果等议题的讨论。
新晋AI国产之光,这下实至名归了!
木易介绍了自己的公众号“AI信息Gap”,专注于分享AI知识,并介绍了国产AI公司DeepSeek的技术和产品。DeepSeek发布了一系列模型,包括V3,并且在性能上表现出色,如参数量大、训练高效等。同时提供了多种使用方式。
登上“最不可能作弊”的榜单,阶跃星辰Step-2位列中国大模型第一|
阶跃星辰自研万亿参数语言大模型Step-2位列全球第五,成绩逼近OpenAI。其表现突出的IF Average指标超越了包括GPT-4在内的所有国内外模型。