GPT-4o
全球首个多模态交互 3D 大模型上线,GPT-4o 没做到的,它先做到了!
GPT-4o 和 Neural4D 2o 是全球首个支持多模态交互的 AI 大模型,实现了文本、图像、3D 等多种模态之间的高效统一处理,大幅提升了内容创作和编辑效率。
吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王
AI名流化身卡牌游戏,GPT-4o创造的AGI霸主奥特曼、吉卜力风全家福引爆网络;纽约客文章揭示背后最大功臣是亚马逊前工程师Grant Slatton。
GPT-4 官宣退役!曾经的最强模型,正式交棒 GPT-4.1、o3、o4 mini!
OpenAI宣布,即将在4月30日下线GPT-4,由更强的GPT-4o全面替代。目前,OpenAI还准备了一大批新模型包括GPT-4.1、GPT-4.1 mini/nano和下一代推理模型o系列等。这些新模型正在筹备中,以应对GPT-4退役后的需求。
Llama 4多模态大模型上线即开源,测试成绩、开源模式广遭质疑
Meta发布首个原生多模态Llama 4系列模型,性能超越GPT-4。包含Maverick、Scout和Behemoth三个模型,支持1000万token上下文。不过其开源模式存在争议,包括登录Hugging Face账户限制、严格再分发要求及命名要求等。
免费开源的吉卜力风格图像神器,小模型掀起大浪潮!效果毫不逊色于GPT-4o!
一款名为EasyControl Ghibli的开源替代方案横空出世,它基于Diffusion Transformer(DiT)架构,免费提供Ghibli风格图像生成功能,支持上传个人照片融入动画宇宙。
RAG用于视频文章生成及东方语种及汉语方言识别Dolphin实现思路解析
今天是2025年4月3日,星期四,北京天气晴朗。文章介绍了关于大模型测试《Large Language Models Pass the Turing Test》,以及RAG用于视频文章生成的方案WIKIVIDEO和面向东方语言的语音识别开源方案Dolphin。